TGTGInsighttelegram intelligenceLIVE / telegram public index
← V2EX
V2EX avatar

TGINSIGHT POST

Post #201109

@pushv2ex

V2EX

Views1帖子阅读量
发布4月14日2026/04/14 01:36
Post content

帖子内容

[酷工作] 高级数据挖掘工程师 上海宜山路 时空数据挖掘:负责⼤规模 GPS 轨迹数据的深加⼯。利⽤ Uber H3 / Geohash 等空间索引 算法,进⾏职住识别、商圈热度分析、⼈群轨迹相似度计算。 训练语料构建 (Corpus):负责将⾮结构化的⾏为⽇志转化为 ⼤模型可理解的⾃然语⾔⽂ 本。例如:将数据库中的标签转化为⾃然语⾔描述,供 AI 团队进⾏预训练使⽤。 ⽤户画像构建:基于 App 安装列表和地理位置特征,构建多维度的⽤户标签体系( Tagging System ),如“加密货币重度⽤户”、“⾼频商旅⼈⼠”等。 数据资产化:配合架构师,将挖掘出的中间结果沉淀为标准化的数据资产表( Data Mart )。Ym9iY3J0Z3ZzQGdtYWlsLmNvbQ==