QEUR23_PHI2SFT13: E語以外のコンテンツを再編成してSFT学習する
~ これは・・・。「対策」が効きましたね。 ~
D先生(設定年齢65歳) : “それでは、前回の知見に基づき、学習データの構造を変えていきましょう。”
D先生(設定年齢65歳) : “学習用のデータセットに新しく、2つの項目(「field」、「uniqueness」)が追加したんですよね。それにしても、今回はデータセットの構造が大きく変わりました。前回の結論は、「(Instructionは)J語で読んでE語で出力する」という方針ですよね?”
QEU:FOUNDER(設定年齢65歳) : “そうですよ。今回の改造後では、E語のQ&Aのみがいままでと同じであって、J語とC語のレコードではQ&Aの構造が大きく変わってきます。すなわち、INSTRUCTIONの内容が英語の指示文になって、Input(Context)の内容がJ語(やC語)になってしまいました。”
(Reasoning)
Please translate the following Japanese input texts into English and respond according to the instruc-tions(English input texts).
D先生(設定年齢65歳) : “新しく設計したReasoning文によると、指示文(J、C語)が一旦翻訳されるんですね?”
QEU:FOUNDER : “そのようにすれば、ファイン・チューンされたE語のReasoningが生きてくるんです。さて、MITライセンスについて、ちょっとだけ宣伝をしておきます。今回は、全部の公開内容がMITライセンスになります。なにしろ、肝心のPHI-2モデルがMITなので・・・。PHI-2は、いいモデルですよ。J語が使えないことを除けば・・・(泣)。”
(重要:MITライセンスへのリンク:これからは、ず~っと使うよ)
(クリックしてね!)
D先生(設定年齢65歳) : “じゃあ、このデータを使ってSFT(Supervised Fine-tuning)学習をやってみましょう!今回のPythonプログラムの公開は?”
QEU:FOUNDER(設定年齢65歳) : “今回はいらないでしょ?プロンプトの構造が若干変わりますが、それに対する対応は自分でちょっと考えればわかりますからね。さて、SFT学習の結果を見てみましょう。ドン!!”
D先生(設定年齢65歳) : “損失の減少結果は、さらに「異次元」になっちゃいました。これほどの効果があるとは・・・。”
QEU:FOUNDER : “Phi-2のLLMにいわせると、E語でのQ&Aはもう楽勝ですから。出力結果をみると、J語の指示文の翻訳(transformed_input)も正しくできていますよね。”
D先生(設定年齢65歳) : “じゃあ、ためしにJ語をむりやり出力をみましょう。これほど学習のレベルが上がったので、結果が良くなっていないかという「スケベごごろ」です・・・(笑)。”
D先生(設定年齢65歳) : “あらら・・・。やはりLLMの地アタマはどうしようもありません(笑)。もう、E語での出力でよいと割り切ってますから、この結果でも問題はないです。さて、翻訳の場合はどうですか?”
QEU:FOUNDER : “このように特殊なやりかたを使っていますから、翻訳そのものの機能は弱くなっていますよ。”
(instructionがJ語の場合)
(instructionがC語の場合)
D先生 : “確かに、今回の仕様変更でLLMが混乱しやすくなっている懸念がありますね。”
QEU:FOUNDER : “おそらく、これからは、あえて翻訳だけをしたい場合にはSYSTEM_PROMPTの内容を変えるしかないんでしょうね。そういえば、D先生・・・。この話(↓)を知っている?”
D先生 : “おお・・・。あのG社が我々と似たような考え方をもっていたとは・・・。追い越されました・・・(笑)。”
QEU:FOUNDER : “彼らのやりかたは、我々のアプローチよりも、はるかにエレガントです。G社はLLMのしくみを知り尽くしているので、Reasoningの効果的な作り方を独自に設計したんです。”
D先生 : “我々もマネをできませんか?”
QEU:FOUNDER : “は?恐れ多いことを・・・。ただし、ファイン・チューン程度であればそれほど気にせずに自分らなりにReasoningを使いこなせばいいと思いますよ。逆に言うと、このようなReasoningの内容の差異が、その人の個性だと思うし・・・。”
D先生 : “やっとDS構造の大改造も終わって、これからいよいよReasoningの生成ですよね。”
QEU:FOUNDER : “今回のタスクもかなり大変ですよ。特にReasoningの生成は・・・。作業を分割しながら、徐々に進めましょう。”
>寄付のお願い(click here)<
QEU:FOUNDER : “まずは、データセット中のReasoningの一部に少しだけ手を入れてみましょう。”
~ まとめ ~
・・・ 前回のつづきです ・・・
QEU:FOUNDER : “もし、LLMの汎用技術構造(↓)の「???」が見いだせれば面白いことになるでしょうね。”
C部長 : “これは、やってみなければわからない。これは面白そうですね。”
QEU:FOUNDER : “品質工学(タグチメソッド)なんて、実務上は推進に手間がかかって、しかも(魅力品質への)効果が少なすぎるんですよ。2025年にはAIの能力が人類に追いつくとも言われています。もうちょっと、他のやりかたを考えないとね。一体、平成の30年になにをしてたの・・・?”
C部長 : “いきなりボクにガタガタ言われても困ります。そもそも、なんのことです?”
QEU:FOUNDER : “C部長は、別に何もする義理もないから、べつにいいんだけどね・・・(笑)。30年前のあの大震災から、全然進歩しなかったんですよね。さて、さっきの「魅力品質」の話にもどるけど、この製品のことを覚えてる?”
C部長 : “ああ、なつかしい・・・。まだあるのかな?これ・・・。”
QEU:FOUNDER : “個人的な評価によれば、華々しく始まったIT(Information technology)黎明期の「あだ花」みたいな製品ですね(笑)。このころ、XMLのようなテクノロジが発明されて言語情報の検索が容易になりました。単純な機能しかないが、それでも思いのほか売れたんですよね。”
C部長: “確かに辞書を持たないですむのはありがたいです。それでも、その効用以上に売れたような気がします。なぜ・・・?この「魅力の正体」は?”
QEU:FOUNDER : “あの当時のIT製品の魅力って、コレ(↑)とおなじ。”
QEU:FOUNDER : “えっ!?わからない!?じゃあ、コレ(↑)と同じです。”
C部長 : “あの時代のちょっと前あたりから、「単に便利になるモノというものは、魅力が薄れちゃった」んですよね。”
QEU:FOUNDER : “・・・というのか、必要なモノは1980年代に一通りそろっちゃったんです。そこで、さらに購入が必要なモノは「自らを変えることができるもの」なんです。今回のQEUプロジェクトは、そこら辺を目指すことになるんでしょうね。それがValueの正体です。”
















コメント
コメントを投稿