AI 以 11 歲作文預測 33 歲學歷，準確率比 DNA 預測還高

2025-11-08 04:47:29 [蔡诗芸] 来源：东观之殃网

日本最新研究顯示，AI 分析 11 歲兒童短篇作文，能精準預測 22 年後學歷及認知力。團隊用 1958 年出生的約萬名英國兒童 11 歲作文，主題為「想像 25 歲的自己」，發現 AI 預估準確度與教師評量差不多，並明顯優於基因預測。

研究分析平均約 250 字的短篇作文，用 OpenAI GPT 模型等大型語言模型提取 1,536 維特徵量，並測量 534 項語言指標、可讀性及文法拼字錯誤等。結果顯示，AI 預測 11 歲孩童理解力準確度達 59%，教師評估為 57%，基因預測只 14%。

同時發現，以作文分析能預測語言能力、數學能力等認知技能，準確度均達 55% 以上。對非認知特質如職業抱負、學習動機等準度較低，但仍優於基因預測。結合作文、教師評估及基因三方法，精準度可提升至近標準智力測驗的重測可信度。更令人驚訝的是，11 歲作文還能精準預測 33 歲學歷等。純粹基於作文的準確度達 26%，教師評估為 29%，基因為 19%。三方法結合後，教育成就準確度可達 38%。

傳統社會學預測因子如父母教育程度僅達 12%，出生體重及身高等生物學指標準確度更只有 1%~3%。團隊重建類似「脆弱家庭挑戰」研究的社會學模型，含性別、父母教育水準、社會階層等變數，準確度為 18%，仍遠低於 AI 文本分析。

細究各文本分析模型，發現深度學習是關鍵。傳統可讀性指標、拼字文法錯誤率、計算語言學測量等雖有一定效果，但深度學習幾乎含所有重要資訊，成為預測準確度的驅動因素。研究採 SuperLearner 框架，結合極端梯度提升、隨機森林、支援向量等多種機器學習演算法，交叉驗證避免過度擬合。結果顯示線性模型及隨機森林大部分預測獲最高權重。

新研究挑戰了「人生本質不可預測」觀點。標準社會調查數據僅能解釋約 20% 個體差異，此研究卻以非標準數據大幅提升精確度。近年自然語言革命性發展，成為行為科學家預測心理社會特徵的強大工具。

國際大學校長橘川武郎等專家認為，雖然顯示文本預測潛力，但仍需考慮倫理問題。準確度持續提升並整合至社會各層面後，如何規範應用系統將成為重要課題。研究也強調需要更多不同類型非標準數據的縱向資料庫，以驗證結果普遍性。

不過研究仍有限制，包括樣本僅為 1958 年出生的英國兒童，是否適用當代學生有待驗證。研究也未充分探索三種資訊來源，之後可用更先進 GPT 模型及貝氏定理提升準確度。