データ分析・サイエンスに知らないと損をする【書籍、オンライン講座、ブログ】50選 | FineReport /* Template Name: singlenew(2019.11.12) */    

データサイエンスに知らないと損をする書籍、オンライン講座、ブログ50選

最終更新日:2020-1-17

データ分析・データサイエンスの仕事をすでにしている、あるいはこれから仕事にする人を問わず、専門書籍とオンライン講座を学び、常に関連サイトかブログから最新の情報と知識を得る必要があります。ここはネットで人気のあるしかも質のいいデータ分析・データサイエンスに関する書籍、オンライン講座とブログ50選をまとめました。ご参考になればうれしいです。

データベース

【関連】
≫データ分析に必要なオープンデータ20選

書籍(13選)

基本知識

1.本物のデータ分析力が身に付く本 (日経BPムック) レイティング:4.2

大阪ガスのデータサイエンティスト集団のノウハウの一部を公開した本です。データ分析のフレームワークとチャートのテンプレートを見て実際にやってみようとする際、最初のデータ収集と処理につまずく方が多いでしょう。本書はワークショップ形式で入門の実践的なスキルを丁寧に教えてくれるので、手順に従ってやりながらデータ分析を覚えられます。

本物のデータ分析力が身に付く本

2.文系のためのデータサイエンスがわかる本 レイティング:5

書名通りに文系人間のためのデータサイエンスの入門書籍です。機械学習モデル、フレームワークについての複雑なコンセプトを解説した上に、著者の経験や応用事例によりデータサイエンスに対する理解を深めてくれます。文系理系を問わずデータ分析の作業に役に立てる一冊だと言えます。

文系のためのデータサイエンがわかる本

基礎スキル

3.Excelで学ぶデータ分析本格入門 レイティング:4.5

本書は販売、企画、顧客、財務のビジネス用途別にExcelのデータ分析機能を徹底的に解説します。データサイエンティストがあくまでもビジネス課題を解決PCでの操作手順のスクリーンショットを載っているので、本書のままで操作すれば迷うことがなく目的に達成できます。ただし、関数とマクロとピボットテーブルがぜんぜんできない方には理解しにくく、勉強の時ネットで調べる必要があります。

Excelで学ぶデータ分析本格入門

4.Head First SQL ―頭とからだで覚えるSQLの基本 レイティング:4.4

プログラミングやデータ分析を楽しく解説するHead FirstシリーズのSQL編です。初学者向けの本として内容が充実しており、テーブルの定義からSQL文そしてDBの作り方まで詳しく説明しました。

Head First SQL ―頭とからだで覚えるSQLの基本

5.統計学入門 レイティング:3.9

アマゾン統計法カテゴリのベストセラー1位の東京大学の統計学教科書であり、同シリーズにはレベルⅡの「人文社会科学の統計学」とレベルⅢの「自然科学の統計学」があります。統計学の大体のことを網羅し、例題の範囲が全面であるほか、練習問題がついています。全体像を掴むには最適であり、辞書的に使うことができます。

統計学入門

6.ビジネス統計学【上】【下】レイティング:4.6

本書(上下)はExcelを使った例題と練習問題により、統計学をビジネスにおける応用を丁寧に解説すします。統計学が苦手な文系出身者でもビジネス場面で必要範囲の統計知識をマスターするように書かれました。ホームページからダウンロードできるExcelの統計ツールを実際に運用することで、難しい統計知識を自然に身につけます。

ビジネス統計学

7.Google流資料作成術:Storytelling with Data レイティング:4

大量のケーススタディを通じて、データ可視化の基本知識だけではなく、どのようにデータの活用によって引きつけて説得力のあるストーリーを作成し、効果的なコミュニケーションを実現するのかも紹介します。 コンテキストの理解、チャートの選択、相手の視線の集中、デザイナーのような考えやストーリーの作成などの内容が含まれています。

Google流資料作成術

上級スキル

8.Pythonによるデータ分析入門 ―NumPy、pandasを使ったデータ処理 レイティング:4.7

多くのケーススタディによって、NumPy、pandas、matplotlib、IPythonなどのPythonライブラリで一連のデータ解析の問題を効果的に解く方法を示します。サンプルコードのダウンロードが可能であり、本書を通してデータをライブラリーに導入するまでの前処理と変形、データの集計・可視化のスキルをマスターできます。

Pythonによるデータ分析入門

9.IPythonデータサイエンスクックブック ―対話型コンピューティングと可視化のためのレシピ集 レイティング:4.4

各章はPythonのデータサイエンスにおける1つまたは2つの重要なツールキットを紹介します。プログラミングの経験を持ち、 データの解析、操作および可視化を目的にPythonを利用するデータサイエンティストに適します。大量情報の処理が必要となる人にとって、本書はデータの操作、変換、クリーンアップ、可視化そして統計モデルと機械学習モデルの構築などの日常問題に効率的に対処できるようにするマニュアルです。  

IPythonデータサイエンスクックブック

10.R in Action: Data Analysis and Graphics with R レイティング:5

Rの強大な機能をまとめた全面的で詳細なRのガイドです。実践的な問題を挙げ、従来のやり方では扱いにくい、不完全データと非正規則分布データをうまく処理する方法を説明します。また、データの探索と視覚化のためのRのグラフィカル機能を習得できます。

R in Action: Data Analysis and Graphics with R

11.Data Mining Techniques: For Marketing, Sales, and Customer Relationship Management レイティング:4

最新のデータマイニング手法を利用し、マーケティング、販売と顧客関係管理におけるビジネス課題を解決する方法を紹介します。さらに、データの準備や企業のデータマイニングに必要なインフラストラクチャの作成など、より高度な内容もカバーしています。

Data Mining Techniques

12.実践 機械学習システム レイティング:4

本書の具体的な例を勉強し、Pythonによって機械学習システムを作成することができます。そして、テキストや画像、音声に対して機械学習の手法をどのように活用するかについても解説します。機械学習を勉強しようとするPythonプログラマーに向いています。

実践 機械学習システム

13.Machine Learning in Action レイティング:3.5

機械学習の基本理論と日常のデータ分析ツールを組み合わせ、複雑で理解しにくい機械学習アルゴリズムをやさしく説明します。 柔軟性の高いPython言語でデータの分類、集計、予測およびアドバイスなどの高度な機能を実装するプログラムを構築する方法を教えるので、Pythonによる機械学習の勉強に実用性の高い一冊です。

Machine Learning in Action

 

オンライン講座(13選)

書籍でデータサイエンスを独学するのは時間がかかるので、現在オンライン講座を利用する方が増えています。書籍と比べて、オンライン講座は系統的にデータサイエンスの知識を教えるのが長所です。以下は有名なオンラインスクールだけではなく、人気のユーチューブチャンネルも挙げます。

1.Dataquest:https://www.dataquest.io/home

データサイエンティスト、データアナリスト、またはデータエンジニアに興味を持つ方は、対話型のコーディングの課題から学習し、現実世界の問題およびデータサイエンスのプロジェクトで成長することができます。

2.Udemy:https://www.udemy.com

世界最大級のオンライン学習プラットフォームとして知られており、現在8,000以上のオンラインコースがあります。 機械学習からデータの視覚化、そしてPythonプログラミングまでを網羅しています。

3.Coursera:https://www.coursera.org/browse/data-science?languages=en

Courseraは世界中の大学や機関と協力してオンラインコースを提供しています。 登録者は録画されたビデオ講義にアクセルできて、宿題が自動評価され、コミュニティディフォーラムにも入れます。コース終了後に電子の修了証明書が発行されます。

4.DataCamp:https://www.datacamp.com

スキルを向上させたい初心者や熟練した専門家にとって、このWebサイトは素晴らしいリソースです。 DataCampは、データサイエンス、統計学および機械学習に関連したインタラクティブなRおよびPythonコースを持っています。

5.Udacity:https://www.udacity.com/course/data-analyst-nanodegree–nd002

Python、SQL、および統計データを利用して真相を洞察し、重要な発見を伝え、データ駆動型ソリューションを作成するのはUdacityのスローガンです。Udacityはビデオだけでなく、独自の学習管理システム、ビルトインプログラミングインターフェース及びフォーラムもあります。

6.EdX:https://www.edx.org/learn/data-science

このサイトでは、データ分析のスキルを養って、知識を高めるための無料のデータサイエンスコースを提供しています。 世界中のトップ大学とEdXのグローバルパートナーのコースを通して、データサイエン、統計、ビジネスインテリジェンスについて学びましょう。

7.Cognitive Class:https://cognitiveclass.ai

このサイトでデータサイエンス、人工知能、ビッグデータ、ブロックチェーンのスキルを無料で受講できます。 アンドロイド向けのアプリがありますので、とても便利と思います。

8.Springboard:https://www.springboard.com/workshops/data-science-career-track?afmc=2h

ここでデータサイエンスの基礎を習得し、必要によって高度な機械学習、自然言語処理、深層学習などの重点分野を選択できます。 実際のプロジェクト演習だけではなく、個性化のキャリアコーチング、および求人サイトも提供しています。

9.Data School(YouTube):https://www.youtube.com/user/dataschool/featured

これは、ワシントンDCでデータサイエンスの教育をしているKevin Markham氏のチャンネルです。 このチャンネルでは、オープンソースツールの使用、PythonとRなど、さまざまなデータサイエンスのテーマについて解説しています。 視聴無料で、現在8万人以上のフォロワーが持っています。

10.Siraj Raval(YouTube):https://www.youtube.com/channel/UCWN3xxRkmTPmbKwht9FuE5A/featured

Siraj Raval氏のチャンネルは、開発者に人工知能の構築を教育するためのビデオを提供しています。 彼はゲーム、音楽、チャットボット、アートなどをAIで作る方法を視聴者に教える魅力的なビデオを作成しました。 視聴無料で、フォロワーが50万人を超えています。

11.IntelliPaat:https://intellipaat.com/tutorials/

IntelliPaatのチュートリアルは、ビッグデータ、ビジネスインテリジェンス、データベースなどのテーマをカバーしています。 業界の専門家から学び、コースを修了すると認定を受けることができます。

12.Lynda:https://www.lynda.com/search?q=data+science

Lyndaでは、ビッグデータ、ビジネスインテリジェンス、データ分析、データベース、プログラミング言語などが含まれます。自分のレベルに合わせて入門、中級、上級のコースから選択できます。

13.Kaggle:https://www.kaggle.com/learn/overview

Kaggleは初心者に最適です。 Python、機械学習、Pandas、データ可視化、R、SQL、またはディープラーニングのコースから選択できます。

データサイエンスサイト・ブログ(24選)

データサイエンスの仕事をする以上、業界の有名人と専門家の考え方と意見が集まるWebサイトやコミュニティから最新の知識を汲む必要があります。以下はデータサイエンスのトレンドを追うには良いサイト・ブログ24選を紹介します。

1.Edwin Chen氏のブログhttp://blog.echen.me

Edwin Chen氏はマサチューセッツ工科大学(MIT)で数学と言語学を専攻して、MRS音声認識、Clariumの量的取引、Twitter広告、Dropbox分析、Googleデータサイエンスなどの仕事をしていました。 AI人工知能とデータに関する記事が、彼のブログで閲覧できます。

2.DataScience.com:https://www.datascience.com/blog

このブログの記事は、データサイエンティスト、ビジネスアナリスト、およびITチームを対象としています。自分の見方をシェアしようと思っている方が このサイトに投稿てみてください。

3.データサイエンス101http://101.datascience.community

コンピュータ科学と統計科学の博士号を取得したRyan Swanstrom氏は、、2012年から自分のブログでデータサイエンスリソース、ニュース、および研究を共有する記事を公開しています。

4.The Shape of Data:https://shapeofdata.wordpress.com/about/

Jesse Johnsonは、低次元トポロジを研究したことがある元数学の教授で、現在Googleのソフトウェアエンジニをしています。 彼のブログは、現代のデータ分析の基本的な考え方について探究し説明しています。

5.Planet Big Data:http://planetbigdata.com

Planet Big Dataは、ビッグデータやHadoopなどのトピックに関するブログをまとめ、世界中のブロガーからの投稿を網羅しています。

6.ビッグデータブログ:http://blog.bigdataweek.com

Big Data Week会議でのインタビューと意見を公開しています。 会議に参加できない場合は、このブログから最新の情報を入手できます。

7.Chris Ablon氏のブログhttps://chrisalbon.com/

Chris Ablonは、統計、人工知能、およびソフトウェアの分野における10年以上の経験を持つデータサイエンティストおよび政治学者です。 彼は政治、社会、人道活動に長けており、これらのデータについて何百もののメモを共有しています。

8.NYC Data Science Academyのブログ:https://nycdatascience.com/blog/

教育機関のNYC Data Science Academyのブログで、 R、Webクロール、機械学習に関する記事を公開しており、オンラインコースもあります。この機関はデータサイエンスの分野で蓄える経験によって、企業にスキルと戦略トレーニングを提供しています。

9.DBMS2:http://www.dbms2.com/

このブログはデータベースとデータ分析のスキルに興味がある方に向いて業界の専門家からのレビューを提供します。その作者のCurt Monash氏は、30年以上にわたって業界に注目してきました。

10.Dta36:https://data36.com/

Tomi Mester氏のブログでは、オンラインデータアナリストのベストプラクティスについて詳しく解説しています。彼はデータ分析、ABテスト、調査研究およびデータサイエンスに関わる記事、コース、ビデオを共有しています。

11.データベース管理システムの運用:http://www.odbms.org/

このサイトは、ビッグデータ、最新のデータ管理テクノロジそしてデータサイエンスのリソースポータルです。編集者はフランクフルト大学のデータベースおよび情報システムの教授です。

12.Yanir Seroussiのブログ:https://yanirseroussi.com/

Yanir Seoussi氏は、プログラミング、コンピュータサイエンス、機械学習、および統計において豊富な経験を持つデータサイエンティストおよびソフトウェアエンジニアです。彼のブログに、孤立したデータの問題から生産システムの構築までのアイデアが含まれています。

13.Simply Statistics:https://simplystatistics.org/

このブログは、Jeff Leek、Roger Peng、Rafa Irizarryの3人の生物統計学教授によって書かれました。彼らは科学的な議論に貢献する興味深い記事についてコメントして、そして新人の統計学者と意見を共有します。

14.What is big data:https://whatsthebigdata.com/

Gil Press氏は、ライティング、リサーチ、マーケティングサービスを提供する「gPress」というコンサルティング事業を経営しています。彼のブログでは、ビッグデータが情報技術、ビジネス業界、政府機関、そして私たちの生活に与える影響について調べています。

15.Towards Data Science:https://towardsdatascience.com/

このブログは、何千人もの人々が意見を交換し、データサイエンスに対する理解を深めるプラットフォームです。各専門のデータサイエンティストからさまざまなアイデアを読むことができます。

16.Alexis Perrierのブログ:https://alexisperrier.com/

Alexis Perrier氏は、あらゆる規模の企業の機械学習を支援したことのあるデータサイエンス講師です。彼は自分のブログで線形回帰などについての詳細な研究を共有しました。

17.Algobeans:https://algobeans.com/

Algobeans氏はケンブリッジ大学のAnnalyn、およびスタンフォード大学のKennethによって設立されました。データサイエンスの愛好家として、彼らは誰でも簡単にデータサイエンスを勉強できるようにサイトを作成しました。

18.Ben Fredericksonのブログ:http://www.benfrederickson.com/blog/

Ben Frederickson氏はカナダのバンクーバーにいるソフトウェア開発者で、ソフトウェア開発とデータサイエンスについてのプロジェクトと発見について共有しました。

19.Daniel Neeのブログ:http://danielnee.com/

Daniel Neeは機械学習とコンピュータ科学に専攻して、データサイエンティストとして働いています。彼のブログに、自分の経験、便利なツール、そしてテクニックに関する投稿があります。

20.Data blogger:https://www.data-blogger.com/category/data-science/

このブログでは、テクノロジー、データサイエンス、ソフトウェアサイエンス、数学などのカテゴリ別に投稿を整理しています。

21.Data Mining Blog:http://www.dataminingblog.com/

Sandro Saitta氏は2016年からデータマイニングの研究を行っています。このデータブログは、データマイニングの研究と運用をカバーしています。

22.DATA DOUBLE CONFIRM:https://projectosyo.wixsite.com/datadoubleconfirm

Hui Xiang Chua氏は 2012年と2016年にシンガポール国立大学でビジネス分析を実施し、現在はシンガポールのリサーチアナリストです。仕事で使用しているツールにR、Python、Tableau、SAS、およびSPSSがあります。 Data Double Confirmで、データサイエンスの勉強経験が書かれており、データの収集、準備、視覚化、および基礎統計のための優れたリソースと言えます。

23.Data Meets Media :http://datameetsmedia.com/

Pio Calderon氏はマニラの金融技術のスタートアップのデータサイエンティストです。このユニークなブログはデータサイエンスとメディアの2つのテーマを中心として、テレビ、映画、そしてデータサイエンスを組み合わせたものです。

24.DataAspirant:https://dataaspirant.com/

Saimadhu Polamuri氏は独学のデータサイエンティストであると同時に、DataAspirantの創業者です。このブログは初心者向けのリソースサイトです。彼はデータサイエンス関連の新興企業で約3年間データサイエンティストをして、5年間のPython経験もあります。そして、Rプログラミング言語にも精通しており、Quoraで教師ありと教師なし学習アルゴリズムの専門家として認めされています。

トップへ

Copyright@2019 Fanruan Software Co.,Ltd

All Rights Reserved