日本最新研究顯示,AI 分析 11 歲兒童短篇作文,能精準預測 22 年後學歷及認知力。團隊用 1958 年出生的約萬名英國兒童 11 歲作文,主題為「想像 25 歲的自己」,發現 AI 預估準確度與教師評量差不多,並明顯優於基因預測。
研究分析平均約 250 字的短篇作文,用 OpenAI GPT 模型等大型語言模型提取 1,536 維特徵量,並測量 534 項語言指標、可讀性及文法拼字錯誤等。結果顯示,AI 預測 11 歲孩童理解力準確度達 59%,教師評估為 57%,基因預測只 14%。
同時發現,以作文分析能預測語言能力、數學能力等認知技能,準確度均達 55% 以上。對非認知特質如職業抱負、學習動機等準度較低,但仍優於基因預測。結合作文、教師評估及基因三方法,精準度可提升至近標準智力測驗的重測可信度。更令人驚訝的是,11 歲作文還能精準預測 33 歲學歷等。純粹基於作文的準確度達 26%,教師評估為 29%,基因為 19%。三方法結合後,教育成就準確度可達 38%。
傳統社會學預測因子如父母教育程度僅達 12%,出生體重及身高等生物學指標準確度更只有 1%~3%。團隊重建類似「脆弱家庭挑戰」研究的社會學模型,含性別、父母教育水準、社會階層等變數,準確度為 18%,仍遠低於 AI 文本分析。
細究各文本分析模型,發現深度學習是關鍵。傳統可讀性指標、拼字文法錯誤率、計算語言學測量等雖有一定效果,但深度學習幾乎含所有重要資訊,成為預測準確度的驅動因素。研究採 SuperLearner 框架,結合極端梯度提升、隨機森林、支援向量等多種機器學習演算法,交叉驗證避免過度擬合。結果顯示線性模型及隨機森林大部分預測獲最高權重。
新研究挑戰了「人生本質不可預測」觀點。標準社會調查數據僅能解釋約 20% 個體差異,此研究卻以非標準數據大幅提升精確度。近年自然語言革命性發展,成為行為科學家預測心理社會特徵的強大工具。
國際大學校長橘川武郎等專家認為,雖然顯示文本預測潛力,但仍需考慮倫理問題。準確度持續提升並整合至社會各層面後,如何規範應用系統將成為重要課題。研究也強調需要更多不同類型非標準數據的縱向資料庫,以驗證結果普遍性。
不過研究仍有限制,包括樣本僅為 1958 年出生的英國兒童,是否適用當代學生有待驗證。研究也未充分探索三種資訊來源,之後可用更先進 GPT 模型及貝氏定理提升準確度。
(本文由 Unwire HK 授權轉載;首圖來源:shutterstock)
文章看完覺得有幫助,何不給我們一個鼓勵
請我們喝杯咖啡您的咖啡贊助將是讓我們持續走下去的動力
總金額共新臺幣 0 元 《關於請喝咖啡的 Q & A》 取消 確認(责任编辑:安妮蓝妮克丝)
很多员工大部分工作了5年以上,每年工资涨40%不好做了。...[详细]
火锅、羊肉串、麻辣香锅……每次在伦敦的中国城吃饭,一道菜接近20镑,我都觉得自己被抢劫了。...[详细]
但这是一个成功率的问题,不是商业模式的问题。...[详细]
1初涉石油贸易 19世纪60年代初,我们组建了一个公司,炼制和出售石油,开始步入石油业。...[详细]
早在2015年,其实针对文字创作者的补贴就已经走过一波了,腾讯最初的芒种计划1.0,今日头条的“千人万元计划”都是例证。...[详细]
如果说孙正义的投资风格比较不可预测,但考虑到孙正义的名气、资金实力和战略资源(譬如在电信领域)以及有时非常具有诱惑性的投资条款会让软银在创业圈继续风光无限,该事件估计也很难对孙正义在投资界的地位造...[详细]
第二是来自其他用户的骚扰,因为狼人杀是视频的形式游戏,有个别玩家对女性的关注度大大超过对游戏本身的热爱。...[详细]
但是如果你有一个大型网站,有许多的页面或者文章,那么使用像GoogleAnalytics这样的工具来获取和审计每个页面的URLs就显得相当有用了。...[详细]
根据读懂新三板研究中心的数据,截止2016年3月16日,新三板共有1700只“僵尸股”,其中1018家企业没有流通股,682家企业有流通股。...[详细]
就拿以下展现图片为例,截止到今日,网站反链为20万1000,与检索的相关结果一致。...[详细]