こんにちは、「今更聞ける！ほぼ毎日テック日報」略してほぼテクの読者の皆様！
本日は5月17日です！本日もよろしくお願いいたします

どうも、GROWTH JAPAN TECHNOLOGIESの我妻裕太です！
週の真ん中水曜日はこちらGJTのサイトから情報発信いたします。

本企画は最新テック情報やスタンダードになったテック情報をお届けする番組です！

ITってなに？
ITってどう使えばいいの？
デジタル？
よくわからない！

とお困りの方に向けた番組です！微力ながらも世の中の皆様のお役に立てれば幸いです。
企画の概要は以下のとおりです。

【配信タイミング】
　ほぼ毎日？

【ターゲット】
　DX担当者やテック系ビジネスパーソン

【配信情報の種類】
　短いニュースレポート

【記事の内容】
　最新のテクノロジーに関する注目すべき話題をお届けします。
　新しい技術が私たちの生活やビジネスにどのような影響を与えるのか、
　専門的な視点から解説します。

本日もやっぱり大好きChatGPTについて情報発信します！

GPTとの冒険！ファインチューニングで試行錯誤、そして成功へ！

ついに今回は大好きなChatGPTのモデルのもとになっているAIのGPT3「davinci」に独自のデータを学習させてみました！これにより自社独自のデータを学習させることができるようになり、自分達オリジナルのChatGPTベースのAIを手にすることができます。
では「GPTとの冒険！ファインチューニングで試行錯誤、そして成功へ！」ご覧ください。

本日は、なんとGPTのファインチューニングに挑んだ我々の壮大な冒険をお伝えします。

そう、これは成功への道のりを切り開く一大プロジェクト！
失敗もありましたが、その全てが我々を成長させる貴重な経験に。

それでは、さっそくそのエキサイティングな旅を共有しましょう！
※本日はアドベンチャー風なタッチでいきます。

Yes, this is a major project that will pave the way to success! There were some failures, but all of them were valuable experiences that helped us grow.
So, let's get started and share this exciting journey with you!

記事の全体像

ファインチューニングへの情熱！その目的と準備
失敗は成功のもと！初期の失敗事例
改良！
達成感！成功への道のり
振り返りと新たな展望！

1. ファインチューニングへの情熱！その目的と準備

我々の壮大な挑戦、それはGPTを使って日本語の応答生成に成功すること！
そのために、OpenAIのPythonライブラリを駆使し、ファインチューニング用のプログラムと学習データを準備しました。

出発点からエキサイティングな冒険が始まりました！

こちらのデータは、我々がGPTに学習させた一例です。

具体的には、ある質問に対する適切な回答を生成するためのデータです。
この学習データは以下のような形式で構成されています。

{ "prompt": "GROWTH JAPAN TECHNOLOGIESとは何ですか？ ->", "completion": " GROWTH JAPAN TECHNOLOGIESは、デジタル技術を活用し、人々の生活に彩りを加え、世界をより良い場所にすることを目指す企業です。革新的なアイデアと情熱を持ち、テクノロジーを活用して社会の大小さまざまな課題を解決します。\n" }

ここで、"prompt"とはAIに与える問い、または入力となります。
この例では、"GROWTH JAPAN TECHNOLOGIESとは何ですか？"という質問がそれにあたります。

一方、"completion"とはAIが生成すべき適切な回答、または出力です。
この例では、"GROWTH JAPAN TECHNOLOGIESは、デジタル技術を活用し、人々の生活に彩りを加え、世界をより良い場所にすることを目指す企業です。革新的なアイデアと情熱を持ち、テクノロジーを活用して社会の大小さまざまな課題を解決します。"がそれにあたります。

このような形式の学習データを多数用意し、GPTに学習させることで、人間が入力した質問やプロンプトに対して適切な回答を生成する能力をAIに身につけさせます。
この具体的な例を通じて、学習データがどのようにAIの挙動に影響を及ぼすか、そのイメージをつかんでいただけたらと思います。

GPTは直接的な回答生成装置ではなく、言語モデルです。
学習データはGPTに特定の回答をそのまま出力させるためのものではなく、特定の入力に対して何を生成すべきかの指針を提供します。

言語モデルは、トークン（単語やフレーズ）の連続した系列（文章など）が与えられたとき、次に来るべきトークンが何であるかを予測するための統計的なモデルです。
学習データに含まれる特定の"prompt"と"completion"のペアは、その文脈において適切な続きを学び取るための一例となります。

したがって、ある"prompt"が与えられたとき、モデルは学習データに基づいて最も適切な"completion"を生成しますが、それが必ずしも学習データの"completion"そのものとは限りません。
学習データの"completion"はあくまで参考の一つで、モデルはそれを基に新しい文章を生成します。

ですので、上記の学習データを使用した場合、"GROWTH JAPAN TECHNOLOGIESとは何ですか？"という入力に対して、モデルは「GROWTH JAPAN TECHNOLOGIESはデジタル技術を活用して社会問題を解決する企業である」といった、学習データの"completion"と同じような意味合いの文章を生成する、というイメージになります。