レポート

2024.10.04(金) 公開

ChatGPTを使ったデータ分析の基本

ChatGPTを使ったデータ分析のチュートリアル

1. はじめに

本記事ではChatGPTを使ったデータ分析のチュートリアルを解説します。ChatGPTはユーザーからのデータを受け取り、前処理、可視化、分析、報告まで一貫して実行するAdvanced Data Analysis (旧Code Interpreter)という機能があります。この機能はユーザーが入力したプロンプトに従って、ChatGPTがプログラミング言語(デフォルトではPython)を使用し、データ分析に必要なコードを生成。さらにその実行結果まで示してくれます。

今回はAdvanced Data Analysisの機能を使いながら初心者の方でも簡単にデータ分析ができるように、ステップバイステップで説明していきます。

2. 分析に使うデータの入力

このチュートリアルでは金融データを分析します。一般にIEFのような債権商品と金利は一方が上がれば一方が下がるといった逆の傾向を示すといわれています。この傾向をデータで確認してみましょう。
今回は実データを模したデータを用意しましたので下記リンクからダウンロードしてください。

(金融データ.csvのダウンロードリンク)

ダウンロードできたらそのファイルをアップロードします。入力欄の左端にあるボタンを押すか、もしくは直接ファイルをドラッグ&ドロップすることでデータをアップロードすることができます。

レポート NOB DATA株式会社 図1 データをアップロードした結果

これでChatGPTへ分析するためのデータを入力することができました。
ChatGPTへのデータの入力には、このように手持ちのデータをアップロードする方法、OneDriveやGoogleドライブと連携させてアップロードすることで、ChatGPTにデータを入力する方法があります。詳しくは以下の参考記事をご覧ください。

【参考記事】

3. データセットの概要を把握して前処理を行う

データの基本統計量を確認することで、データの概要を把握します。下記がプロンプトとその実行結果です。

レポート NOB DATA株式会社 図2 IEF価格と米国債金利の基本統計量

今回は整形済みのデータを使っていますが、データの概要を把握した際に、データが分析に適していない形式であることに気づくことは多々あります。このようなデータを整形していくステップをデータの前処理といいます。他記事ではデータ前処理について解説しているのでご覧ください。

【参考記事】

4. データの可視化

次に、データの可視化を行います。今回は時系列プロットを使って、IEF価格と米国債金利の分布や時間の経過による変動を視覚的に確認します。下記がプロンプトとその実行結果です。

レポート NOB DATA株式会社 図3 IEF価格と米国債金利の時系列プロット

データの可視化は今回使ったような時系列プロットの他にも散布図やヒストグラム、箱ひげ図など様々な方法があります。他記事ではデータ可視化について解説しているのでご覧ください。

【参考記事】

5. 分析

傾向をより明確に把握するために移動平均を使って、データの長期的なトレンドを確認します。移動平均は、短期的な変動を平滑化し、長期的な傾向を明確にするための手法です。下記がプロンプトとその実行結果です。

レポート NOB DATA株式会社 図4 IEF価格と米国債金利の移動平均

IEF価格と米国債金利に一方が上がれば一方が下がる傾向が確認できました。ChatGPTではより高度な分析が可能です。他記事ではChatGPTで実行できる分析手法について解説しているのでご覧ください。

【参考記事】

6. 分析結果をレポートにまとめる

最後にここまでの分析結果をPowerPointのレポートにまとめてみましょう。下記がプロンプトとその実行結果です。

レポート NOB DATA株式会社 図5 PowerPointのレポートを出力

ChatGPTではPowerPointの他にもテキストやExcelなど様々な形で出力できます。他記事ではこのような出力方法について解説しているのでご覧ください。

【参考記事】

この記事では、ChatGPTを使ったデータ分析のチュートリアルとして基本的な流れを紹介しました。ChatGPTを活用して、さらに高度な分析に挑戦してみてください。

この記事の著者

レポート NOB DATA株式会社

データサイエンティスト

市川 太祐

医師・医学博士。名古屋市立大学客員准教授。データサイエンティスト。データを用いた意思決定に長年取り組む。予防医療から電子カルテデータ、ライフログデータまで幅広い分析経験を持つ。「R言語徹底解説」(共立出版)、「データ分析プロジェクトの手引き」 (共立出版)等、データ分析関連の著書・訳書多数。

「ChatGPT導入・活用支援」はNOB DATAにご相談ください

ChatGPTの導入・活用に課題を感じていませんか?
NOB DATAでは、ChatGPT開発およびデータ分析・AI開発のプロフェッショナルが、多種多様な業界・課題解決に取り組んだ実績を踏まえ、ChatGPTの導入・活用を支援しています。社員向けのChatGPT研修も実施しており、お気軽にお問い合わせください。

ChatGPT導入・活用支援の詳細を見る