データサイエンス Data Science & Computer
1. はじめ
データサイエンスの定義
統計学、コンピュータ・情報技術、計算科学



Source: drewconway
• その他:
► コンピュータの速度・性能が高くなった。
► 通信速度が高くなった
► データの収集、保存、共有がやりやすく、安価になった。
► 人工知能(AI)などの技術が生活の一部になった。
背景、参考資料
• 1996: 「データサイエンス」という言葉が学会志の表紙に出た

• 1997: 「統計学」→「データ科学」という提案 (Jeff Wu) があった。
• Forbe : A Very Short History Of Data Science
データサイエンスの役割
• The purpose of data science: description, prediction.
• データサイエンスの役割はデータの記述と予測です。
• The whole idea is…
► data mining データマイニング
► knowledge extraction 知識抽出
► information discovery 情報発見, information harvesting 情報収穫
► data archeology データ考古, and data pattern processin データ処理 など
2. コンピュータ 計算機
• Computer: is a device that takes input, and process it to generate output
Early mechanical computing device 初期の計算機械
• 算盤

• Slide rules 計算尺

• Charles Babbageの 機械コンピュター
正式名称:階差機関。数値計算のために作られた(1819ごろ)。

Charles Babbage's computer on youtube
Early Electronic computer 初期の電子計算器
• ENIAC:The first electronic, Turing-complete device.It had been used to perform ballistics trajectory calculations

• IBM early Personal Computer(PC) パソコン

Present Computer






3. Contral Processing Unit (CPU) 中央処理装置
• Processor プロセッサ:コンピュータにおける中心的な処理装置
• Electronic circuitry that carries our the instruction of a program.
• It performs the basic arithmetic, logical control and I/O operation specified by the instruction
• プログラムの指令にしたがって、演算などを行う。


Clock rate
• The frequency at which a CPU running
• Indicator of CPU speed
• 1995年のパソコン:
• 今のパソコン:
• Smart phone:
4. Memory メモリ、記憶装置
RAM: Random Access Memory 主記憶装置
• Accessible directly by CPU.
• Store data temporarily for immediate use. 一旦保存用
• Fast 速い
• Volatile memory 揮発性メモリ。使い終わったら消える。
• 例:DDR4 SDRAM

Auxilliary 補助記憶装置
• Non-Volatile memory 非揮発性メモリ
• Hard disk, CD-ROM, USB flash memory, SSDなど

5. Operating System (OS) オペレーティングシステム
• System that manages the computer hardware, memory, resource and software.
• コンピュターの資源の管理.

OS の例
• Android
• iOS





6. File system ファイルシステム
• Directory ディレクトリ(Folder フォルダー とも呼ばれる)

Storage device

実習: Create new folder 新しいフォルダーの作成
• 右クリック
•
• フォルダーの名前を入力して、Enter キーを押す。
実習: Rename folder フォルダーの名前の変更
• フォルダーを左クックで選択。
• 右クリック
•
• フォルダーの名前を入力して、Enter キーを押す。
実習: Copy folder フォルダーのコピー
• フォルダーを左クックで選択。
• 右クリック
•
• 目的地で右クッリク。
•
実習: Move folder フォルダーの移動
• フォルダーを左クックで選択。
• 右クリック
•
• 目的地で右クッリク。
•
7. File format ファイルフォーマット
• ファイルの保存形式.
• 文書、音声、画像、動画などのファイルを共通に扱うための形式や規格.
File format の例
• 文字:Text テキストファイル (.txt)
• 文章:Office Open XML (.docx)
• 画像:Portable Network Graphic (.png)
• 文章:Portable Document Format (.pdf)
• 動画:MPEG-4 (.mp4)
• 音声:MPEG-1 Audio Layer III (.mp3)
• ウエブ:Hypertext Markup Language (.html)






8. Internet インターネット
• Global interconnected computer network
• 世界規模のコンピューターネットワーク
• 伝送する情報を Packet 「パケット」に分割し、ネットワーク内を転送する。
• Result of ARPANET [Advanced Research Projects Agency Network]
• Communication system originally designed to survive Nuclear Attack.
• 「インターネットは「核攻撃」を耐えられるコンピューターネットワークの実現を目指して開発された。



Internetの発明者の一人 Vint Cerf 本人が説明する:
9. World Wide Web (WWW) ワールドワイドウェブ
• Internet インターネットを用いる。
• Web Page ウェブページの概念を用いる。
• Hypertext ハイパーテキストを使用。
• Web Page ウェブページの概念を用いる。
• インターネット上の文書、資源を相互に参照可能とする (Hyperlink)。
• 参照のため、URLを用いる。


HTML samples
•sample 1:簡単の文字の表示

•sample 2:文字と図の表示

10. Julia プログラミング言語の紹介

• Julia は計算科学や数値解析のための高水準言語(high level programming)。
► 無償。自由に配布可能。
► オープンソース(プログラムの内容が公開されている)。
► 文法は数学の言語に近い。
• 2009年に開発が始まり、また若いですが、発展は急速である。
• 他の高水準言語( Python、 R、 Perl、 Matlab (有料)。
• Julia の 正式ホームページ からダウンロードができる。
• インストールなしで Jupyter または repl.it を使って、Julia の体験ができる。
11. 作業:Julia のインストル
ダウンロード&インストル
• Julia のホームページから該当のファイルをクリックしてダウンロードしてください。
• リンクはこちら
Screenshot 1

Screenshot 2

• ダウンロードしたファイルをダブルクリックしてインストルをしてください。
• メセージが出たら、おすすめの設定でOKです
• インストルができたら、Juliaを開いてください。
REPL
Juliaを起動したら、次の画面が出てくる。
それはREPL (Read, Evaluate, Print, Loop)です
入力・評価・画面出力・ループのこと
対話的に、順次にコマンド、コードを実行できる環境です

12. 作業:Julia Package の装着
• ローマ字の「終わり角括弧」キー


外部パケージ Plots を追加する
パケージ管理モードで指令

パケージ管理モードで指令

インストール済みのパケージが表示される。
13. 実習:Julia を用いて演算
• Julia のREPLで演算を練習してください。
画面に印刷、表示
julia> print("hello world" )
hello world
四則演算:足し算
julia> 1.2 + 2.3
3.5
julia> 7.8 - 5.6
2.2
julia> 2 * 3
6
julia> 3 / 2
1.5
冪演算 (べきえんざん)
julia> 10^3 #10の3乗
1000
julia> 2^4
16
余り
julia> 5 % 2 #5割る2余り
1
三角関数
julia> sin(pi/2 ) #piは π のことです
1.0
julia> cos(pi/4 )
0.7071067811865476
変数
julia> a = 3
3
julia> (a + 2 )^2
25
関数
julia> f(x) = x^2 + x + 1
f (generic function with 1 method)
julia> f(2 )
7
実習:Plots のテスト
julia> using Plots
plot(rand(100 ))

14. 作業:Visual Studio Code のインストル
宿題作業:Visual Studio Code のインストル
Windows、Linux、macOS用のソースコードエディタです。
ダウンロードのリンクは こちら
• ダウンロードしてインストルしてください。
