レポート

2024.10.04(金) 公開

ChatGPTを使ったデータ分析の基本

データの可視化

本記事ではChatGPT上でのデータの可視化について解説します。

1. データのアップロード

まずは、例として使用するデータをアップロードしましょう。

今回はデータ前処理の具体例として、「図書館の支出データ」を準備しました。下記リンクからダウンロードしてください。

(図書館支出データ_欠測なし.csvのダウンロードリンク)

データセットの前提条件として、以下のデータの情報・状態を以下の通りとします。

  • 区分: 都道府県
  • 総額: 図書館に関する費用の総額
レポート NOB DATA株式会社 図1 サンプルデータ

2. 棒グラフを用いてデータを可視化する

準備したデータを用いてデータを可視化してみましょう。ここでは棒グラフを用いて県別の費用総額を比較します。

レポート NOB DATA株式会社 図2 棒グラフによる可視化例 レポート NOB DATA株式会社 図3 棒グラフを費用総額の多い順に並べ替えした例

3. ChatGPT-4oで可能な可視化の例

ChatGPT-4oで可能な可視化の例を以下に示します。

可視化種別
説明
棒グラフ
カテゴリごとのデータ比較に最適です。
折れ線グラフ
時系列データの変化を視覚化します。
円グラフ
全体に対する各要素の割合を表示します。
ヒストグラム
データの分布を確認するのに役立ちます。
散布図
2つの変数間の関係を視覚化します。
箱ひげ図
データの分散や外れ値を視覚化します。

横スワイプで続きを御覧ください

表1 ChatGPT-4oのデータ可視化種別

ChatGPT-4oでは特にこちらから指定しない限り、Advanced Data Analysisのデフォルト機能である、PythonのMatplotlibというライブラリを使ってデータの可視化をします。
他にどのような可視化ができるかについては下記のMatplotlibの公式サイトを確認するとよいでしょう。

【参考記事】

この記事の著者

レポート NOB DATA株式会社

データサイエンティスト

市川 太祐

医師・医学博士。名古屋市立大学客員准教授。データサイエンティスト。データを用いた意思決定に長年取り組む。予防医療から電子カルテデータ、ライフログデータまで幅広い分析経験を持つ。「R言語徹底解説」(共立出版)、「データ分析プロジェクトの手引き」 (共立出版)等、データ分析関連の著書・訳書多数。

「ChatGPT導入・活用支援」はNOB DATAにご相談ください

ChatGPTの導入・活用に課題を感じていませんか?
NOB DATAでは、ChatGPT開発およびデータ分析・AI開発のプロフェッショナルが、多種多様な業界・課題解決に取り組んだ実績を踏まえ、ChatGPTの導入・活用を支援しています。社員向けのChatGPT研修も実施しており、お気軽にお問い合わせください。

ChatGPT導入・活用支援の詳細を見る