AI生成問答の改訂版（一）：CoTと材料選択

私は以前、Anki カードを作成するためのプロンプトを GPT-4 で生成しました。これは、Auto Prompt に触発されたもので、AI が出力結果の品質を評価した後に自分のプロンプトを継続的に調整し、最適化を図ることを目的としています。Claude と GPT-4 で以下のプロンプトを実験しました：

抽認カードを作成する際には、SuperMemo の 20 のルール、AP 試験や他の試験の問題、さまざまなチュートリアルのガイドラインを十分に参考にしてください。同時に、以下の要件に従ってください：

抽認カードは簡潔で明確であり、重要な情報に集中してください。
質問は具体的で明確であり、あいまいさを避けてください。
簡単で直接的な言葉を使用し、カードが読みやすく理解しやすいことを確保してください。
答えは 1 つの重要な事実 / 名前 / 概念 / 用語のみを含むべきです。
質問の適用性と普遍性を考慮し、異なるシーンや知識分野で実際に適用できる価値を持つことを確認してください。
質問の妥当性に注意し、誤解や疑問を引き起こさないようにしてください。

以下は SuperMemo の 20 のルールの概要です：

理解できない場合は学ばないこと。
学習材料は質問と答えの形式に基づくべきです。
最小情報原則：各質問はできるだけ簡潔であるべきです。
ブール質問（はい / いいえの質問）を避けること。
質問の表現を最適化すること。
抽象的ではなく具体的な質問を使用すること。
純粋な理論知識ではなく、応用的な知識に焦点を当てること。
質問の難易度を均衡させ、あまりにも簡単または複雑な質問を避けること。
学習の興味を高めるために多様な質問形式を使用すること。
答えが思い出しやすく理解しやすいことを確認すること。
文脈の手がかりを通じて思い出すのを助けること。
質問を作成する際には、さまざまな学習の視点を考慮すること。
知識を独立した、習得しやすい部分に分解すること。
適切な時に画像、図表、その他の視覚的補助ツールを利用すること。
適切な復習計画を策定し、長期記憶を確保すること。
間隔反復法を使用して記憶効果を高めること。
混同しやすい知識点に特定の質問を作成すること。
異なる分野の知識を統合し、より高次の理解を形成すること。
定期的に抽認カードを更新および修正し、知識の正確性と最新性を確保すること。
自分の学習プロセスにフィードバックと調整を行い、学習効果を高めること。

テキスト：太陽は太陽系で唯一の恒星であり、水素とヘリウムで構成されています。太陽の中心温度は約 1500 万度です。このような高温下で、水素の原子核が核融合反応を起こし、ヘリウム原子を形成し、大量のエネルギーを放出します。

SuperMemo の 20 のルールに基づいて、テキストから情報を抽出し、以下の抽認カードを作成できます：

質問	答え
太陽系で唯一の恒星は何ですか？	太陽。
太陽は主にどの 2 種類の気体で構成されていますか？	水素とヘリウム。
太陽の中心温度は約何度ですか？	1500 万度。
太陽の高温の中心で、水素の原子核は何の反応を起こしますか？	核融合反応。
核融合反応で、水素の原子核は何の元素を形成しますか？	ヘリウム元素。
太陽の核融合反応はどのようなエネルギーを放出しますか？	大量のエネルギー。

テキスト：地球の自転一周の時間は 23 時間 56 分 4 秒で、この時間は恒星日と呼ばれます。地球が太陽の周りを一周する時間は約 365.24 日で、回帰年と呼ばれます。
SuperMemo の 20 のルールに基づいて抽認カードを作成します：

質問	答え
地球の自転一周の時間は何と呼ばれますか？	恒星日。
恒星日の長さはどれくらいですか？	23 時間 56 分 4 秒。
地球が太陽の周りを一周する時間は何と呼ばれますか？	回帰年。
回帰年の長さは約何日ですか？	365.24 日。

このセットの抽認カードは以下のルールに従っています：

ルール 2：学習材料は質問と答えの形式に基づいています。
ルール 3：最小情報原則、質問はできるだけ簡潔です。
ルール 5：質問の表現を最適化し、質問を明確で理解しやすくします。
ルール 10：答えが思い出しやすく理解しやすいことを確認します。
ルール 13：知識を独立した、習得しやすい部分に分解します。

これらの抽認カードを通じて、SuperMemo の 20 のルールが実際の制作プロセスにどのように適用されるかを見ることができます。もちろん、テキストの内容や学習目標によっては、他のルールを採用する必要があるかもしれません。重要なのは、抽認カードを作成する際にこれらのルールを総合的に考慮し、学習効果を高めることです。

抽認カードを作成する際には、以下の点に注意してください：

異なる知識分野や背景に応じて、SuperMemo の 20 のルールを柔軟に活用してください。
実際のニーズに応じて、AP 試験や他の試験の問題、さまざまなチュートリアルのガイドラインを参考にしてください。
質問の適用性と普遍性に注意し、異なるシーンや知識分野で実際に適用できる価値を確保してください。
質問の妥当性を保ち、誤解や疑問を引き起こさないようにしてください。

以上の要点を総合的に考慮することで、より効果的に抽認カードを作成し、学習効果を高めることができます。以下は提供するテキストです：
。。。。。。。。

例を挙げる#

Claude と GPT-4 で、詳細な問題を説明するために大量の例を挙げるテキストを生成する際、約 8 割の問答がテキストから独立して存在できず、手動で修正する必要があるという現象が見られました；

詳細事実の分解と原子化#

GPT-4 は独立した質問をうまく提起できますが、答えが複数のステップや要点に関わる場合、リスト化の悪夢に陥りやすく、要点やステップを分解して記憶しやすいカードを形成することを忘れがちです。彼が理解する事実は、問題から出発することが重要であり、答えではありません。

Claude は一部中英混合の現象が見られるだけでなく、チェーン式の質問の現象も発生し、1 つの問答の下に 3 つの母問題に関する子問題が必要になることがあり、過度に省略されています。例えば、「これは何を反映していますか？」、「公式間の一貫性を反映しています」。

latex 公式の保持#

latex 公式は quicker の好未来 OCR を使用して無料で認識しています。少なくとも mathpix の有料問題を考慮する必要はありません。まずテキスト OCR を完了し、その後公式部分を一つ一つ認識します。

学習材料の選択#

良い入門教材は初心者がより早く習得できるようにします。復旦大学が出した『高等代数学』のように。
テキストの表現が簡潔で論理的であればあるほど、生成される問答は良くなりますが、欠点は文法的に主語や目的語などを尋ねる能力が低く、異なる形式で同じ論理と思想の質問に変換する能力が乏しいことです。入力されたテキストの書き方のスタイルが一貫している必要があります。そうでないと、Waluigi 効果が増加しやすくなります。

長さの問題#

詳細な内容の陳述が生成される問答は比較的詳細であり、テキストの長さや対話の長さが増すにつれて、Waluigi 効果が増加します。

モデルの問題#

Claude は一部中英混合の現象が見られますが、一貫性は強く保たれ、フィードバックと調整はあまり良くありません。問題の冗長性は良好に保たれています。
GPT-4 はあまりにも一般的な質問を生成しやすいですが、背景を提供する能力は Claude よりも強く、フィードバックと調整能力も高いです。質問が少なく、冗長性が低いです。

プロンプトの問題#

プロンプトを書く際に注意すべきは、パターンと特殊性であり、何をするかに焦点を当て、何をしないかに焦点を当てないことです。

Claude と GPT-4 は辞書テキストに対して「例を挙げてください」という質問を生成しやすいですが（数量も少ない）、これは辞書テキストに対する質問が最適化されていないためです。もう一つの問題は、深い文学的問題において勝てることを保証できない「微細な理解」の問題です。簡単に言えば、古代の「小学」の言語を細分化する学問です。彼らはモデルの確率問題に基づいており、元々のトレーニングデータに高頻度の言語や分野知識が含まれている場合、高品質で正確な内容を生成しますが、誤りやあいまいな用法の確率は依然として存在します。彼らは自動的に誤りやあいまいながらも正しいように見える用法に適合させるように校正します。

私は以前、辞書や文字の説明の生成問題に関するプロンプトを書いたことがありますが、上記のプロンプトとは大きく異なります。例えば：

言語学習における文のマイナーは、文法書や辞書を使用してフラッシュカード（主に Q&A 形式）を作成する人々のことです。
例えば、テキスト：welcome2 ●●● S2 W3 形容詞
1 あなたは歓迎されます SPOKEN 何かに感謝されたときに返答する礼儀正しい方法
‘コーヒーをありがとう。’ ‘どういたしまして。’
2 誰かが場所で歓迎されている場合、他の人々はその人がそこにいることを喜んでいます
私は本当に歓迎されていないと感じました。
クラブでは歓迎されていないと感じました。
メアリーは私たちを非常に歓迎してくれました。
私たちは新入生を歓迎するように努めています。
3 何かが歓迎される場合、それは必要だと感じるため、楽しむことができます
週末は仕事のプレッシャーからの歓迎される休息でした。
スコットランドでの 6 ヶ月はロンドンからの歓迎される変化になるでしょう。
一杯の紅茶は非常に歓迎されるでしょう。
4 何かが歓迎される場合、それが起こったことを喜んでいます
金利の上昇は投資家にとって歓迎されるニュースです。
この新しい資金は業界にとって歓迎される後押しとなるでしょう。
5 何かを歓迎される SPOKEN 誰かがそれを望む場合、それを持つことができると言うために使用されます。なぜなら、あなたは確かにそれを望んでいないからです
その仕事を取りたいなら、あなたはそれを歓迎されます！
6 何かをすることを歓迎される SPOKEN 誰かに何かをするように招待するために使用されます。もし彼らが望むなら
あなたは昼食に滞在することを歓迎されます。
Q&A: Q: 誰かが「どういたしまして」と返答するにはどうすればよいですか？ (SPOKEN)
A: 「どういたしまして」は、何かに感謝されたときに返答する礼儀正しい方法です。
Q: どのような状況で誰かが歓迎されていないと感じることがありますか？
A: 誰かが場所で歓迎されていない場合、それは他の人々がその人がそこにいることを喜んでいないことを意味します。
Q: 「メアリーは私たちを非常に歓迎してくれました」の「歓迎」の意味は何ですか？
A: 誰かが場所で歓迎されている場合、他の人々はその人がそこにいることを喜んでいます。つまり、メアリーは他の人々が私たちがそこにいることを喜んでいるということです。
Q: 「週末は仕事のプレッシャーからの歓迎される休息でした」の「歓迎」の意味は何ですか？
A: 何かが歓迎される場合、それは必要だと感じるため、楽しむことができます。つまり、その休息は私が必要としているということです。
Q: いつ誰かが何かを歓迎されると感じることがありますか？
A: 何かが歓迎される場合、それは必要だと感じるため、楽しむことを意味します。
Q: 「金利の上昇は投資家にとって歓迎されるニュースです」の「歓迎」の意味は何ですか？
A: 何かが歓迎される場合、それが起こったことを喜んでいることを意味します。つまり、金利の上昇が起こったということです。
Q: 誰かが「どういたしまして」を使って何かをするように招待するにはどうすればよいですか？
A: 「昼食に滞在することを歓迎されます」。
Q: 「何かを歓迎される」の意味は何ですか？(SPOKEN)
A: 誰かがそれを望む場合、それを持つことができると言うために使用されます。なぜなら、あなたは確かにそれを望んでいないからです。
Q: 「あなたがその仕事を取りたいなら、あなたはそれを歓迎されます！」の「何かを歓迎される」の意味は何ですか？
A: それは、私はその仕事を取ることができることを意味します。なぜなら、話者は確かにそれを望んでいないからです。
Q: 「何かをすることを歓迎される」の意味は何ですか？(SPOKEN)
A: 誰かに何かをするように招待するために使用されます。もし彼らが望むなら。
Q: 「あなたは昼食に滞在することを歓迎されます」の「何かをすることを歓迎される」の意味は何ですか？
A: 聴衆を昼食に滞在するように招待するために使用されます。

私はテキストを提供して Q&A 形式を生成します。

論理学の思想（CoT）#

AI を使用して問答を形成する際のもう一つの欠陥は、彼らがしばしば文中の単一の文法部分に基づいて質問を行うことです。しかし、問答問題を形成する際には、「xxx と xxx の関係は何ですか？」や「yyy は xxx と xxx の関係ですか？」だけではなく、具体的な帰納、比較、テキストの論理的思考が必要です（流暢で論理的な言語を使用することは、知識と文言のテンプレートの構築に役立ちます。簡素化された表現は時に厳密ではなく、テンプレートはさらに分解できます。例えば、数学やコンピュータ思想は常に細分化され、記憶の複雑な問題を学ぶ際に異なる原子知識モジュールや原子的方法ステップを動員することを学びます）。

感想：#

是非問題を避ける：もし問答が正誤を判断するだけで理由を示さない場合、学習者は混乱し不満を感じやすくなります。
背景と引用：問答をテキストからより独立させるためには、明確な背景と引用を提供し、学習者がどの学問分野の知識であるかを理解できるようにする必要があります。例えば、数学における関数はマッピング関係であり、コンピュータ科学ではメソッドの別名です。情報源を紹介するために文献引用のような方法を使用し、後で確認や修正ができるようにします。
質問の多様性と冗長性：学習者がある詳細についてより深く理解できるように、異なる角度からの質問を提起し、彼らの能動的な思い出しや思考能力を刺激する必要があります。したがって、できるだけ多くの質の高い質問を生成するようにします。これらの質問は異なる角度からテーマに切り込み、異なるレベルでの理解を評価します。例えば、ある概念についてその定義、機能、特性などを同時に尋ねることができます。
プロンプトとカードは常に修正が必要であり、この記事では異なるバージョンのプロンプトとその効果を記録します。

正に：

テキストに基づいてフラッシュカードを生成します。（仮）
フラッシュカードは強力な学習ツールです。また、作成するのが面倒です。
一部の読者は、学習している科目のフラッシュカードを生成するために ChatGPT を使用していると言いました。これは「言葉の計算機」としての LLM の能力の範囲内のようです。したがって、正しいプロンプトを使用すれば、ここでかなり良い結果を得ることができます。ただし、変換したい材料を入力し、LLM が自動的に事実を取得することを期待しない限りです（以下を参照）。
しかし、「良い」フラッシュカードを作成するのが難しいため、私は最初にレビューすることなく Anki に入力することはありません。それでも、フラッシュカードを作成するのは面倒なので、後でレビューする初稿を得ることでプロセスをかなり迅速化できるかもしれません。カードの正確性を確認する前にデッキに入れる場合、リスクは比較的限られています。——Scott.H.Young