Jupyter Notebookは、データサイエンティストにとって最も頼りになるツールです。データの視覚化、簡単な分析、およびコラボレーションに使用できるインタラクティブなWebインターフェイスを提供します。
データの視覚化により、マップまたはグラフを通じてデータのコンテキストを見つけることができます。このチュートリアルは、JupyterNotebookでグラフを操作するための洞察に満ちたガイドを提供します。
前提条件
必要がある Jupyterがインストールされている あなたのマシンで。そうでない場合は、コマンドラインに次のコードを入力してインストールできます。
$ pip install jupyter
また、 パンダ と matplotlib 図書館:
Windows8.1用のWindows7テーマ
$ pip install pandas
$ pip install matplotlib
インストールが完了したら、JupyterNotebookサーバーを起動します。これを行うには、ターミナルで以下のコマンドを入力します。現在のディレクトリ内のファイルを表示するJupyterページが、コンピューターのデフォルトのブラウザーで開きます。
$ jupyter notebook
ノート: このコマンドを実行するターミナルウィンドウを閉じないでください。閉じた場合、サーバーは停止します。
単純なプロット
新しいJupyterページで、次のコードを実行します。
import matplotlib.pyplot as plt
x=[1,2,3,4,5,6,7,8]
y=[2,4,6,8,10,12,14,16]
plt.plot(x,y)
plt.show()
コードは単純な折れ線グラフ用です。最初の行は ピプロット からのグラフ作成ライブラリ matplotlib API。 3行目と4行目は、それぞれx軸とy軸を定義します。
NS プロット() グラフをプロットするためにメソッドが呼び出されます。 NS 見せる() 次に、メソッドを使用してグラフを表示します。
代わりに曲線を描きたいとします。プロセスは同じです。の値を変更するだけです Pythonリスト y軸の場合。
import matplotlib.pyplot as plt
x=[3,4,5,6,7,8,9,10,11,12]
y= [9,16,25,36,49,64,81,100,121,144]
plt.plot(x,y)
plt.show()
重要なことに注意してください。どちらのグラフにも、明示的なスケール定義はありません。スケールは自動的に計算され、適用されます。これは、Juypterが提供する多くの興味深い機能の1つであり、コードを気にすることなく、作業(データ分析)に集中できます。
警戒している場合は、x軸とy軸の値の数が同じであることに気付くかもしれません。それらのいずれかが他よりも小さい場合、コードを実行するとエラーのフラグが立てられ、グラフは表示されません。
利用可能なタイプ
上記の線グラフや曲線とは異なり、他のグラフの視覚化(ヒストグラム、棒グラフなど)を表示するには、明示的に定義する必要があります。
棒グラフ
棒グラフを表示するには、を使用する必要があります バー () 方法。
import matplotlib.pyplot as plt
x=[3,4,5,6,7,8,9,10,11,12]
y= [9,16,25,36,49,64,81,100,121,144]
plt.bar(x,y)
plt.show()
散布図
あなたがする必要があるのは使用することです scatter() 前のコードのメソッド。
import matplotlib.pyplot as plt
x=[3,4,5,6,7,8,9,10,11,12]
y= [9,16,25,36,49,64,81,100,121,144]
plt.scatter(x,y)
plt.show()
円グラフ
円グラフは、上記の他の部分とは少し異なります。 4行目は特に興味深いので、そこにある機能を見てください。
figsize アスペクト比を設定するために使用されます。これは好きなように設定できます(例:(9,5))が、公式のPandasドキュメントでは、アスペクト比1を使用することを推奨しています。
import matplotlib.pyplot as plt
x=[4,9,16,25,36]
fig = plt.figure(figsize =(9, 5)) # line 4
plt.pie(x)
plt.show()
円グラフには、注目に値するいくつかのパラメーターがあります。
ラベル -これを使用して、円グラフの各スライスにラベルを付けることができます。
色 -これを使用して、各スライスに事前定義された色を与えることができます。色は、テキスト形式(例:黄色)または16進形式(例: '#ebc713')の両方で指定できます。
以下の例を参照してください。
import matplotlib.pyplot as plt
x=[4,9,16,25,36]
fig = plt.figure(figsize =(5.5, 5.5))
plt.pie(x, labels=('Guavas', 'Berries','Mangoes','Apples', 'Avocado'),
colors = ( '#a86544', '#eb5b13', '#ebc713', '#bdeb13', '#8aeb13'))
plt.show()
のような他のプロットもあります 歴史 、 範囲 、 と どこ あなたができること パンダのドキュメントで詳細を読む 。
プロットの書式設定
上記のプロットには、ラベルなどの側面はありません。その方法は次のとおりです。
タイトルを追加するには、JupyterNotebookに以下のコードを含めます。
matplotlib.pyplot.title('My Graph Title')
x軸とy軸には、それぞれ次のようにラベルを付けることができます。
matplotlib.pyplot.xlabel('my x-axis label')
matplotlib.pyplot.ylabel('my y-axis label')
詳細はこちら
あなたは実行することができます ヘルプ() ノートブックのコマンドを使用して、Jupyterコマンドに関するインタラクティブな支援を受けます。特定のオブジェクトに関する詳細情報を取得するには、次を使用できます。 ヘルプ(オブジェクト) 。
また、csvのデータセットを使用してグラフを描画してみることもお勧めします。 ファイル。データを視覚化する方法を学ぶことは、調査結果を伝達および分析するための強力なツールであるため、スキルを身に付けるために時間をかける価値があります。
共有 共有 つぶやき Eメール パンダを使用してExcelデータをPythonスクリプトにインポートする方法高度なデータ分析には、PythonがExcelよりも優れています。 Pandasを使用してExcelデータをPythonスクリプトにインポートする方法は次のとおりです。
次を読む 関連トピック- プログラミング
- Python
- コーディングチュートリアル
- データ分析
ジェロームはMakeUseOfのスタッフライターです。彼はプログラミングとLinuxに関する記事をカバーしています。彼は暗号愛好家でもあり、常に暗号業界を監視しています。
ジェローム・デビッドソンのその他の作品ニュースレターを購読する
ニュースレターに参加して、技術的なヒント、レビュー、無料の電子書籍、限定セールを入手してください。
購読するにはここをクリックしてください