Topic 1

目次

1) はじめ 2) コンピュータ 計算機 3) Contral Processing Unit (CPU) 中央処理装置 4) Memory メモリ、記憶装置 5) Operating System (OS) オペレーティングシステム 6) File system ファイルシステム 7) File format ファイルフォーマット 8) Internet インターネット 9) World Wide Web (WWW) ワールドワイドウェブ 10) Julia プログラミング言語の紹介 11) 作業:Julia のインストル 12) 作業:Julia Package の装着 13) 実習:Julia を用いて演算 14) 作業:Visual Studio Code のインストル Topic 2 へ移動共通資料:Plots全体目次

データサイエンス CDS009    (チェン leechuin@yamanashi.ac.jp) 更新日: 2022-10-10


データサイエンス Data Science & Computer

1. はじめ

データサイエンスの定義

統計学コンピュータ・情報技術計算科学 などの融合科目です。

Source: drewconway

 • その他:

        ► コンピュータの速度・性能が高くなった。

        ► 通信速度が高くなった

        ► データの収集、保存、共有がやりやすく、安価になった。

        ► 人工知能(AI)などの技術が生活の一部になった。


背景、参考資料

 • 1996: 「データサイエンス」という言葉が学会志の表紙に出た

 • 1997: 「統計学」→「データ科学」という提案 (Jeff Wu) があった。

 • Forbe : A Very Short History Of Data Science

 • Wikipedia Data science

 • Wikipedia データサイエンス

データサイエンスの役割

 • The purpose of data science: description, prediction.

 • データサイエンスの役割はデータの記述と予測です。

 • The whole idea is…finding useful patterns in data

        ► data mining データマイニング

        ► knowledge extraction 知識抽出

        ► information discovery 情報発見, information harvesting 情報収穫

        ► data archeology データ考古, and data pattern processin データ処理 など


2. コンピュータ 計算機

 • Computer: is a device that takes input, and process it to generate output

Early mechanical computing device 初期の計算機械

 • 算盤

 • Slide rules 計算尺

 • Charles Babbageの 機械コンピュター

    正式名称:階差機関。数値計算のために作られた(1819ごろ)。

    Charles Babbage's computer on youtube


Early Electronic computer 初期の電子計算器

 • ENIAC:The first electronic, Turing-complete device.It had been used to perform ballistics trajectory calculations

 • IBM early Personal Computer(PC) パソコン


Present Computer


3. Contral Processing Unit (CPU) 中央処理装置

 • Processor プロセッサ:コンピュータにおける中心的な処理装置

 • Electronic circuitry that carries our the instruction of a program.

 • It performs the basic arithmetic, logical control and I/O operation specified by the instruction

 • プログラムの指令にしたがって、演算などを行う。

Clock rate

 • The frequency at which a CPU running

 • Indicator of CPU speed

 • 1995年のパソコン:100 MHz

 • 今のパソコン:3~4 GHz

 • Smart phone:~2 GHz


4. Memory メモリ、記憶装置

RAM: Random Access Memory 主記憶装置

 • Accessible directly by CPU.

 • Store data temporarily for immediate use. 一旦保存用

 • Fast 速い

 • Volatile memory 揮発性メモリ。使い終わったら消える。

 • 例:DDR4 SDRAM


Auxilliary 補助記憶装置

 • Non-Volatile memory 非揮発性メモリ

 • Hard disk, CD-ROM, USB flash memory, SSDなど


5. Operating System (OS) オペレーティングシステム

 • System that manages the computer hardware, memory, resource and software.

 • コンピュターの資源の管理.

OS の例

 • Microsoft Window,

 • Linux (Unix系)

 • OS X (Unix系)

 • Android

 • iOS


6. File system ファイルシステム

 • Filename ファイル名

 • Directory ディレクトリ(Folder フォルダー とも呼ばれる)

 • Extension 拡張子


Storage device


実習: Create new folder 新しいフォルダーの作成

 • 右クリック

 • 「新しいフォルダー」を左クリックで選択

 • フォルダーの名前を入力して、Enter キーを押す。


実習: Rename folder フォルダーの名前の変更

 • フォルダーを左クックで選択。

 • 右クリック

 • 「名前の変更」を左クッリクで選択。

 • フォルダーの名前を入力して、Enter キーを押す。


実習: Copy folder フォルダーのコピー

 • フォルダーを左クックで選択。

 • 右クリック

 • 「コピー」を左クッリクで選択。

 • 目的地で右クッリク。

 • 「貼り付け」を左クッリクで選択。


実習: Move folder フォルダーの移動

 • フォルダーを左クックで選択。

 • 右クリック

 • 「切り取り」を左クッリクで選択。

 • 目的地で右クッリク。

 • 「貼り付け」を左クッリクで選択。


7. File format ファイルフォーマット

 • ファイルの保存形式.

 • 文書、音声、画像、動画などのファイルを共通に扱うための形式や規格.

File format の例

 • 文字:Text テキストファイル (.txt)

 • 文章:Office Open XML (.docx)

 • 画像:Portable Network Graphic (.png)

 • 文章:Portable Document Format (.pdf)

 • 動画:MPEG-4 (.mp4)

 • 音声:MPEG-1 Audio Layer III (.mp3)

 • ウエブ:Hypertext Markup Language (.html)


8. Internet インターネット

 • Global interconnected computer network

 • 世界規模のコンピューターネットワーク

 • 伝送する情報を Packet 「パケット」に分割し、ネットワーク内を転送する。

 • Result of ARPANET [Advanced Research Projects Agency Network]

 • Communication system originally designed to survive Nuclear Attack.

 • 「インターネットは「核攻撃」を耐えられるコンピューターネットワークの実現を目指して開発された。

Internetの発明者の一人 Vint Cerf 本人が説明する:


9. World Wide Web (WWW) ワールドワイドウェブ

 •  Internet インターネットを用いる。

 • Web Page ウェブページの概念を用いる。

 • Hypertext ハイパーテキストを使用。

 • Web Page ウェブページの概念を用いる。

 • インターネット上の文書、資源を相互に参照可能とする (Hyperlink)

 • 参照のため、URLを用いる。

HTML samples

•sample 1:簡単の文字の表示

•sample 2:文字と図の表示


10. Julia プログラミング言語の紹介

 • Julia は計算科学や数値解析のための高水準言語(high level programming)。

        ► 無償。自由に配布可能。

        ► オープンソース(プログラムの内容が公開されている)。

        ► 文法は数学の言語に近い。

 • 2009年に開発が始まり、また若いですが、発展は急速である。

 • 他の高水準言語( PythonRPerlMatlab (有料)

 • Julia の 正式ホームページ からダウンロードができる。

 • インストールなしで Jupyter または repl.it を使って、Julia の体験ができる。


11. 作業:Julia のインストル

ダウンロード&インストル

 • Julia のホームページから該当のファイルをクリックしてダウンロードしてください。

 • リンクはこちら

Screenshot 1

Screenshot 2

 • ダウンロードしたファイルをダブルクリックしてインストルをしてください。

 • メセージが出たら、おすすめの設定でOKです

 • インストルができたら、Juliaを開いてください。


REPL

Juliaを起動したら、次の画面が出てくる。

それはREPL (Read, Evaluate, Print, Loop)です

入力・評価・画面出力・ループのこと

対話的に、順次にコマンド、コードを実行できる環境です


12. 作業:Julia Package の装着

 • ローマ字の「終わり角括弧」キー ] を入力すると、画面がJuliaのパケージ管理モードとなる。

Control-c:Controlキーを押しながら、c をオスしたら、通常モードに戻る。

外部パケージ Plots を追加する

] を入力して、Juliaのパケージ管理モードに入る。

パケージ管理モードで指令 add Plots を入力する。

パケージ管理モードで指令 status を入力する。

インストール済みのパケージが表示される。

Control-c をオスして通常モードに戻る。


13. 実習:Julia を用いて演算

 • Julia のREPLで演算を練習してください。

画面に印刷、表示

julia> print("hello world")
hello world

四則演算:足し算 +, 引き算 -, 掛け算 *, 割り算 /

julia> 1.2 + 2.3
3.5

julia> 7.8 - 5.6
2.2

julia> 2 * 3
6

julia> 3 / 2
1.5

冪演算 (べきえんざん)^

julia> 10^3 #10の3乗
1000

julia> 2^4
16

余り %

julia> 5 % 2 #5割る2余り
1

三角関数

julia> sin(pi/2) #piは π のことです
1.0

julia> cos(pi/4)
0.7071067811865476

変数

julia> a = 3
3

julia> (a + 2)^2
25

関数

julia> f(x) = x^2 + x + 1
f (generic function with 1 method)

julia> f(2)
7


実習:Plots のテスト

julia> using Plots
plot(rand(100))


14. 作業:Visual Studio Code のインストル

宿題作業:Visual Studio Code のインストル

Windows、Linux、macOS用のソースコードエディタです。

ダウンロードのリンクは こちら

 • ダウンロードしてインストルしてください。