科(kē)技日报北京12月19日電(diàn) (记者张梦然)《自然·计算科(kē)學(xué)》18日发表的一项研究描述了一个机器學(xué)习方法,该方法能(néng)从不同方面准确预测人类生活,包括早死可(kě)能(néng)性和个性的细微差异。该模型或能(néng)提供对人类行為(wèi)的量化认知。
社会科(kē)學(xué)家对人类生活是否能(néng)被预测的问题看法不一。虽然人们对起到重要作用(yòng)的社会人口學(xué)因素已有(yǒu)充分(fēn)了解,但却一直无法对生命结局进行准确预测。
利用(yòng)丹麦國(guó)家登记处约600万人的教育、健康、收入、职业和其他(tā)生活事件数据,丹麦技术大學(xué)研究团队设计了一个机器學(xué)习方法,以构建个體(tǐ)的人类生活轨迹。团队通过调整语言处理(lǐ)技术,用(yòng)类似模型中语言的方式表达人类生活。这种方法能(néng)以类似语言模型捕捉词语间复杂关系的方式生成一个生活事件的术语表。他(tā)们提出的模型名為(wèi)“life2vec”,能(néng)确定健康相关诊断、居住地、收入水平等概念之间的复杂关系,并用(yòng)一个压缩向量编码个人生活,以此作為(wèi)预测生活结局的基础。
研究团队证明,该模型可(kě)预测早死率,即年龄组在35岁至65岁的个體(tǐ)自2016年1月1日起存活4年的概率。另外,其捕捉细微个性差异的能(néng)力超过了当下先进的模型和基線(xiàn)标准,表现至少提升11%。
研究结果表明,通过表征社会结局和健康结局之间的复杂关联,准确预测生活结局也许是可(kě)以做到的。但团队也强调,他(tā)们的研究只是对可(kě)能(néng)性的探索,而且只应在确保个人权利受到保护的监管下才可(kě)用(yòng)于现实世界。