TGTGInsighttelegram intelligenceLIVE / telegram public index
Post content
Post content
life2vec:一个将丹麦统计局提供的人生事件序列进行向量编码和预测的项目 Using Sequences of Life-events to Predict Human Lives https://www.nature.com/articles/s43588-023-00573-5 / https://arxiv.org/abs/2306.03009 这是丹麦统计局和国家社交网络项目支持的一项研究,数据源未公开,基于 Transformer 网络。该网络最后能够将每个人一生的事件序列编码为一个单一向量,随后使用了 TCAV 概念激活向量测试,即手动挑选具有给定特征不同值的数据样本形成一个概念向量并验证其是否激来进行模型含义的解释。 模型仅仅通过 NLP 方法,在没有任何预先知识的情况下最终生成了有效的概念编码和概念集群(如图),并且能够理解文本化的数值字符串之间的严格邻近和正负关系。对于健康、职业等概念也有有意义的结果。 模型进行了预测死亡率和死亡年龄的尝试。模型在年轻和女性人群中预测效果更好,生活事件的数量对模型的影响并不明显。另外,该模型能够预测人格细微差别,包括内向性和外向性。 #论文#机器学习#人工智能#Transformer#NLP