Topic 1

目次

1) はじめ 2) コンピュータ 計算機 3) Contral Processing Unit (CPU) 中央処理装置 4) Memory メモリ、記憶装置 5) Operating System (OS) オペレーティングシステム 6) File system ファイルシステム 7) File format ファイルフォーマット 8) Internet インターネット 9) World Wide Web (WWW) ワールドワイドウェブ 10) Julia プログラミング言語の紹介 11) 実習:Julia を用いて演算

データサイエンス CDS009    (チェン leechuin@yamanashi.ac.jp) 更新日: 2024-02-02


データサイエンス Data Science & Computer

1. はじめ

データサイエンスの定義

統計学コンピュータ・情報技術計算科学 などの融合科目です。

Source: drewconway

 • その他:

        ► コンピュータの速度・性能が高くなった。

        ► 通信速度が高くなった

        ► データの収集、保存、共有がやりやすく、安価になった。

        ► 人工知能(AI)などの技術が生活の一部になった。


背景、参考資料

 • 1996: 「データサイエンス」という言葉が学会志の表紙に出た

 • 1997: 「統計学」→「データ科学」という提案 (Jeff Wu) があった。

 • Forbe : A Very Short History Of Data Science

 • Wikipedia Data science

 • Wikipedia データサイエンス

データサイエンスの役割

 • The purpose of data science: description, prediction.

 • データサイエンスの役割はデータの記述と予測です。

 • The whole idea is…finding useful patterns in data

        ► data mining データマイニング

        ► knowledge extraction 知識抽出

        ► information discovery 情報発見, information harvesting 情報収穫

        ► data archeology データ考古, and data pattern processin データ処理 など


2. コンピュータ 計算機

 • Computer: is a device that takes input, and process it to generate output

Early mechanical computing device 初期の計算機械

 • 算盤

 • Slide rules 計算尺

 • Charles Babbageの 機械コンピュター

    正式名称:階差機関。数値計算のために作られた(1819ごろ)。

    Charles Babbage's computer on youtube


Early Electronic computer 初期の電子計算器

 • ENIAC:The first electronic, Turing-complete device.It had been used to perform ballistics trajectory calculations

 • IBM early Personal Computer(PC) パソコン


Present Computer


3. Contral Processing Unit (CPU) 中央処理装置

 • Processor プロセッサ:コンピュータにおける中心的な処理装置

 • Electronic circuitry that carries our the instruction of a program.

 • It performs the basic arithmetic, logical control and I/O operation specified by the instruction

 • プログラムの指令にしたがって、演算などを行う。

Clock rate

 • The frequency at which a CPU running

 • Indicator of CPU speed

 • 1995年のパソコン:100 MHz

 • 今のパソコン:3~4 GHz

 • Smart phone:~2 GHz


4. Memory メモリ、記憶装置

RAM: Random Access Memory 主記憶装置(揮発性)

 • Accessible directly by CPU.

 • Store data temporarily for immediate use. 一旦保存用

 • Fast 速い

 • Volatile memory 揮発性メモリ。使い終わったら消える。

 • 例:DDR4 SDRAM


Auxilliary 補助記憶装置(ストレージ、非揮発性)

 • Non-Volatile memory 非揮発性メモリ

 • Hard disk, CD-ROM, USB flash memory, SSDなど

磁性体を塗布した円盤と、磁気ヘッドを用いた、情報を記録し読み出すハードディスクドライブ(Hard disk drive)

集積回路を用いたソリッドステートドライブ(Solid state drive [SSD])


5. Operating System (OS) オペレーティングシステム

 • System that manages the computer hardware, memory, resource and software.

 • コンピュターの資源の管理.

OS の例

 • Microsoft Window,

 • Linux (Unix系)

 • OS X (Unix系)

 • Android

 • iOS


6. File system ファイルシステム

 • Filename ファイル名

 • Directory ディレクトリ(Folder フォルダー とも呼ばれる)

 • Extension 拡張子


Storage device


実習: Create new folder 新しいフォルダーの作成

 • 右クリック

 • 「新しいフォルダー」を左クリックで選択

 • フォルダーの名前を入力して、Enter キーを押す。


実習: Rename folder フォルダーの名前の変更

 • フォルダーを左クックで選択。

 • 右クリック

 • 「名前の変更」を左クッリクで選択。

 • フォルダーの名前を入力して、Enter キーを押す。


実習: Copy folder フォルダーのコピー

 • フォルダーを左クックで選択。

 • 右クリック

 • 「コピー」を左クッリクで選択。

 • 目的地で右クッリク。

 • 「貼り付け」を左クッリクで選択。


実習: Move folder フォルダーの移動

 • フォルダーを左クックで選択。

 • 右クリック

 • 「切り取り」を左クッリクで選択。

 • 目的地で右クッリク。

 • 「貼り付け」を左クッリクで選択。


7. File format ファイルフォーマット

 • ファイルの保存形式.

 • 文書、音声、画像、動画などのファイルを共通に扱うための形式や規格.

File format の例

 • 文字:Text テキストファイル (.txt)

 • 文章:Office Open XML (.docx)

 • 画像:Portable Network Graphic (.png)

 • 文章:Portable Document Format (.pdf)

 • 動画:MPEG-4 (.mp4)

 • 音声:MPEG-1 Audio Layer III (.mp3)

 • ウエブ:Hypertext Markup Language (.html)


8. Internet インターネット

 • Global interconnected computer network

 • 世界規模のコンピューターネットワーク

 • 伝送する情報を Packet 「パケット」に分割し、ネットワーク内を転送する。

 • Result of ARPANET [Advanced Research Projects Agency Network]

 • Communication system originally designed to survive Nuclear Attack.

 • 「インターネットは「核攻撃」を耐えられるコンピューターネットワークの実現を目指して開発された。

Internetの発明者の一人 Vint Cerf 本人が説明する:


9. World Wide Web (WWW) ワールドワイドウェブ

 •  Internet インターネットを用いる。

 • Web Page ウェブページの概念を用いる。

 • Hypertext ハイパーテキストを使用。

 • Web Page ウェブページの概念を用いる。

 • インターネット上の文書、資源を相互に参照可能とする (Hyperlink)

 • 参照のため、URLを用いる。

HTML samples

•sample 1:簡単の文字の表示

•sample 2:文字と図の表示


10. Julia プログラミング言語の紹介

 • データサイエンス及統計の実習(5回目以降)はJuliaを用いて行う。

 • Julia は計算科学や数値解析のための高水準言語(high level programming)。

        ► 無償。自由に配布可能。

        ► オープンソース(プログラムの内容が公開されている)。

        ► 文法は数学の言語に近い。

 • 2009年に開発が始まり、また若いですが、発展は急速である。

 • 他の高水準言語( PythonRPerlMatlab (有料)

 • Julia の 正式ホームページ からダウンロードができる。

 • インストールなしで Jupyter または repl.it を使って、Julia の体験ができる。


REPL

Juliaを起動したら、次の画面が出てくる。

それはREPL (Read, Evaluate, Print, Loop) [入力・評価・画面出力・ループ]のことです。

対話的に、順次にコマンド、コードを実行できる。


11. 実習:Julia を用いて演算

 • Julia のREPLで演算を練習してください。

画面に印刷、表示

julia> print("hello world")
hello world

四則演算:足し算 +, 引き算 -, 掛け算 *, 割り算 /

julia> 1.2 + 2.3
3.5

julia> 7.8 - 5.6
2.2

julia> 2 * 3
6

julia> 3 / 2
1.5

冪演算 (べきえんざん)^

julia> 10^3 #10の3乗
1000

julia> 2^4
16

余り %

julia> 5 % 2 #5割る2余り
1

三角関数

julia> sin(pi/2) #piは π のことです
1.0

julia> cos(pi/4)
0.7071067811865476

変数

julia> a = 3
3

julia> (a + 2)^2
25

関数

julia> f(x) = x^2 + x + 1
f (generic function with 1 method)

julia> f(2)
7


実習:Plots のテスト

julia> using Plots

julia> plot(rand(100))

一度 using Plots を実行したら、再び実行する必要ない。

下記のコマンドを実行してください。

julia> x = 0:0.1:6 #xは 0 から 6まで,間隔は 0.1
0.0:0.1:6.0

julia> plot(x, sin.(x))

他の関数もplotしてみてください。

例:三角関数

julia> plot(x, cos.(x))

例:指数函数

julia> plot(x, exp.(x))# 指数函数

例:ユーザー定義関数

julia> g(x) = (x-3)^2
g (generic function with 1 method)

julia> plot(x, g.(x))