ほぼテク8月23日最新情報アップデート!ついに待望のGPT-3.5 ファインチューニング!試してみました!
ほぼテク読者の皆様、いつも大変ありがとうございます!
我妻裕太です。
本日もよろしくお願いいたします。GPTに関する連続投稿約121日目です!
本日のテーマはこちらです!
最新情報アップデート!ついに待望のGPT-3.5 ファインチューニング試してみました!
AIの分野で最も有名なモデルであるGPT-3.5が、ついにファインチューニングが可能になりました!
今回は、この最先端のモデルをファインチューニングしてみた経験を共有したいと思います。
GPT-3.5とは?
GPT-3.5は、OpenAIによって開発された強力な言語モデルで、あらゆる種類の自然言語処理タスクに対応しています。
その設計と機能性は、前のバージョンから大幅な進展を遂げ、更なる柔軟性とパワーを提供しています。
ファインチューニングとは?
ファインチューニングとは、既存の訓練済みモデルを特定のタスクやデータセットに最適化するプロセスです。
GPT-3.5をファインチューニングすることで、特定のニーズに合わせてモデルの性能を調整することができます。
ファインチューニングのプロセス
1.データの準備
タスクに合ったデータセットを用意しました。
このデータセットは、モデルがファインチューニングする際の基礎となります。
データのイメージは以下のようなjsonl形式です。
jsonlとは 改行区切りの1レコードがjsonになっているデータのことです。
{"messages": [{"role": "system", "content": "You are a model trained to provide information about GROWTH JAPAN TECHNOLOGIES."},{"role": "user", "content": "GROWTH JAPAN TECHNOLOGIESで働く魅力は何ですか?"},{"role": "assistant", "content": "GROWTH JAPAN TECHNOLOGIESで働く魅力は、革新的なプロジェクトに取り組む機会、素晴らしいチームメンバーとの共同作業、およびデジタル技術を使用して社会に貢献することができることです。"}]}
※ポイントは上記の1行が最低10行必要な点です。10行以下ですとエラーになりましたので、ご注意ください。
2.ファイルアップロード
上記で準備したデータをアップロードします。コマンドは以下のようなイメージです。
レスポンスに「id」のプロパティが表示されますので、そこに書かれているのがファイルのIDでこの後使用しますのでメモしてください。
curl -X POST https://api.openai.com/v1/files -H "Authorization: Bearer $API-KEY" -F "purpose=fine-tune" -F "file=@gpt-3.5-fine-tuning.json"
※「API-KEY」にはAPIのキーを設定してください。「gpt-3.5-fine-tuning.json」には学習データのファイル名をしてください。
レスポンスに「id」のプロパティが表示されますので、そこに書かれているのがファイルのIDでこの後使用しますのでメモしてください。
3.ファインチューニング
OpenAIのAPIを利用してファインチューニングを開始します。このプロセスは自動化されており、特別なコーディングのスキルは必要ありませんでした。
コマンドは以下のようなイメージです。
レスポンスに「id」のプロパティが表示されますので、そこに書かれているのがファインチューニングのジョブのIDでこの後使用しますのでメモしてください。
curl https://api.openai.com/v1/fine_tuning/jobs -H "Content-Type: application/json" -H "Authorization: Bearer $API-KEY" -d "{""training_file"": "“トレーニングファイルのID"", ""model"": ""gpt-3.5-turbo-0613""}"
※「API-KEY」にはAPIのキーを設定してください。「トレーニングファイルのID」には前述したファイルのIDを指定してください。
4.実行状況確認
学習が終わったかどうかは以下のコマンドで確認することができます。「"status":"succeeded"」がレスポンスの中にあれば完了です!
curl https://api.openai.com/v1/fine_tuning/jobs/ジョブのID -H "Authorization: Bearer $API-KEY"
※「API-KEY」にはAPIのキーを設定してください。「ジョブのID」には前述したジョブのIDを指定してください。
ちなみに以下のようなファインチューニング完了のメールも届きました。
10行の学習データでファインチューニング完了まで3分くらいでしょうか。
5.会話してみよう!
以下のコマンドで会話できます!
curl https://api.openai.com/v1/chat/completions -H "Content-Type: application/json" -H "Authorization: Bearer $API-KEY" -d "{\"model\": \"ft:gpt-3.5-turbo-0613:personal::7qajjfea\", \"messages\": [{\"role\": \"system\", \"content\": \"You are an assistant that knows about GROWTH JAPAN TECHNOLOGIES.\"}, {\"role\": \"user\", \"content\": \"GROWTH JAPAN TECHNOLOGIESの創業者は誰ですか?\"}]}"
※「API-KEY」にはAPIのキーを設定してください。
結果は以下のようなレスポンスが返ってきます!
"choices": [
{
"index": 0,
"message": {
"role": "assistant",
"content": "GROWTH JAPAN TECHNOLOGIESの創業者は、デジタル技術と社会貢献に深い情熱を持つ我妻裕太氏です。"
},
"finish_reason": "stop"
}
おぉーーーー、なんが凄い感動です!
いいですね。
以前のGPT-3シリーズのファインチューニングは回答がいまいちな印象でしたが、GPT-3.5はいい感じな気が勝手にしています(笑)
色々と学習のオプションがあったりデータを増やしてもっと色々と実験してみたいと思います。
いやーいいですね!
今回の記事がみなさまの何かの参考になりましたら幸いです。
今回も最後までお読みいただきありがとうございました。
また次回お会いしましょう。
原稿執筆
株式会社GROWTH JAPAN TECHNOLOGIES 我妻裕太
バックナンバー
ほぼテク8月20日Webデザインの新時代!?ChatGPTとWebページデザイン!?
ほぼテク8月19日Webデザインの新時代!?天気アプリのモックアップをChatGPTと考えてみました!
ほぼテク8月17日最近また戻ってきた?ChatGPT新機能を試してみた!
ほぼテク8月16日GPTのライバルになるか?満を持して登場のLINEの「japanese-large-lm(ジャパニーズ ラージ エルエム)」で日本語が得意か実験してみました!
ほぼテク8月15日CodeInterpreterを使い始める前に!?CodeInterpreterの実行環境における制限について!
ほぼテク8月14日ITセキュリティの新時代?ChatGPTによるシステムログのレポート作成!?ワードクラウド編②!
ほぼテク8月13日ITセキュリティの新時代?ChatGPTによるシステムログのレポート作成!?ワードクラウド編①!
ほぼテク8月12日ITセキュリティの新時代?ChatGPTによるシステムログのレポート作成!
ほぼテク8月11日ITセキュリティの新時代?ChatGPTによるシステム異常の自動検出!?改!
ほぼテク8月9日ついに我が家にもGPT-4がやってきた?API利用開始まで1ヵ月かかりました(笑)
ほぼテク8月6日GPTの力で未来を予測!?GPT-4が時系列分析モデルARIMAを構築!
ほぼテク8月5日最新情報アップデート!Metaの生成AI「AudioCraft」とGPTのコラボレーション?
ほぼテク8月2日GPTのライバルになるか?満を持して登場のIBMのwatsonxで日本語が得意か実験してみました!
ほぼテク7月30日GPT-4のCode Interpreterで気象分析にチャレンジしてみた!?
ほぼテク7月29日GPT-4のCode Interpreterで身体を引き締める?ChatGPTをパーソナルトレーナーにする方法!?
ほぼテク7月26日ソフトウェア開発におけるSQL作成の課題をChatGPTが解決!?人間とAIで開発する次世代のソフトウェア開発!?
ほぼテク7月23日ChatGPTが変える業務効率化!ChatGPTを使った次世代のタスク管理!?
ほぼテク7月22日ChatGPTをあなた専用のAIにカスタマイズ!新機能「Custom Instructions」の紹介です!
ほぼテク7月19日GPTのライバルになるか?満を持して登場のMetaのLlama2が先ほど公開されました!
ほぼテク7月17日海の日にちなんで?多様化するDBの波を乗り越えられるかをChatGPTで試してみました。
ほぼテク7月16日GPT-3.5、GoogleBardでシフト管理を考えてみました!
ほぼテク7月15日GPT-4 Code InterpreterでG20の人口成長率を分析してみたら新しい気づきをくれました!
ほぼテク7月12日最新情報アップデート!GPT-4一般公開されたけど、APIで支払い履歴がないと使えないことが分かりましたの件(涙)
ほぼテク7月9日最新機能ChatGPTの「Code Interpreter(コードインタープリター)」を使ってみました!
ほぼテク7月7日SaaSサービスの利用規約のひな型をGPT、Bardで作ってみました!
ほぼテク7月5日BingのGPTの画像認識を解剖?ChatGPTとの違いと画像解析の可能性を探る!
ほぼテク7月2日ChatGPT・GoogleBardを活用したコンテンツモデレーション(投稿監視)!コミュニティの健全性と品質をChatGPT、GoogleBardで保てるか?
ほぼテク7月1日ChatGPTを活用してオンラインショッピングサイトのカスタマーサポートを効率化しよう?
ほぼテク6月28日AIと一緒にダイエット?ChatGPT、GoogleBardに体重データを分析してもらった!なかなか面白いよ(笑)
ほぼテク6月25日GPTの最新機能!「Azure OpenAI Service on your data」を試してみました!
ほぼテク6月24日GPTの活用事例!チャットボット用のQAデータをGPTで作成してみた!
ほぼテク6月21日GPT4の活用事例!生成AI達でAIの教師データを生成してみよう。
ほぼテク6月17日ChatGPTの活用ガイド!AIをあなたのプロジェクトに取り入れる方法徹底解説?
ほぼテク6月14日!ChatGPTを活用するために重要な留意事項13選! AIとのスムーズな対話を実現!
ほぼテク6月11日!ChatGPTでSNSマーケティングを攻略しよう!
ほぼテク6月10日!ChatGPTで情報の抽出をマスターしよう!
ほぼテク6月7日!ChatGPTを使って業務効率化! - データ解析とレポート作成の新たな方法?
ほぼテク6月4日!ChatGPTでマスタ情報を活用した間違い探し!
ほぼテク5月31日!ChatGPTでファンタジーは創造できるか?
ほぼテク5月28日!ChatGPTで地元仙台市を分析してみました!
ほぼテク5月27日!ChatGPTでWebサイトから重要な情報を取得できるか試してみました!
ほぼテク5月24日!ChatGPTプラグイン実践編!画像生成のためのプロンプト生成プラグイン!
ほぼテク5月21日!ChatGPTプラグイン実践編!食べログプラグイン!
ほぼテク5月20日!とても面白いChatGPTのプラグイン使ってみました!
ほぼテク5月17日!GPTとの冒険!ファインチューニングで試行錯誤、そして成功へ!
ほぼテク5月14日!ChatGPT Webブラウジング機能がリリースされました!
ほぼテク5月13日!ChatGPTを活用した創作活動の一例!物語のプロットを創ってみた。
ほぼテク5月12日!Bard – Googleの新しい会話型AIが世界デビュー!
ほぼテク5月10日!今、私たちは新たなフロンティア、つまり宇宙へと視野を広げています!
ほぼテク5月7日!Chat GPTの正しい使い方基本プロンプトで会話してみました④
ほぼテク5月6日!Chat GPTの正しい使い方基本プロンプトで会話してみました③
ほぼテク5月5日!Chat GPTの正しい使い方基本プロンプトで会話してみました②
ほぼテク5月4日!Chat GPTの正しい使い方基本プロンプトで会話してみました①
ほぼテク5月3日ImageCreatorで生成した画像で展示会?
今更聞ける!ほぼ毎日テック日報(おとなの週末) 4月30日(マイクロソフト画像生成AI「Bing Image Crator」とは?) – テクノロジーが日常にもたらすイノベーション?
今更聞ける!ほぼ毎日テック日報(おとなの週末) 4月29日(完全自動実行AI AutoGPTとは?) – テクノロジーが日常にもたらすイノベーション?