TGINSIGHT CHAT
Data Science Archive
@DataScienceArchive
科技小熊猫的个人工具收纳箱,还包括一些零碎的笔记,大概会有这些: * 有趣/有价值/SOTA的会议论文和代码分享 * 自然语言处理,计算机视觉,语音信号领域进展 * Kaggle 和其他算法竞赛经验 * 反作弊,搜索和个性化推荐算法产品的工程化 * 统计学习,矩阵计算,贝叶斯相关的工具 * 可视化、算法服务相关的存储、并行和分布式计算工具 希望我收集的信息也可以帮到你,如果有其他建议,或者寻找工作机会,都可以给我发邮件: [email protected]
最近帖子
第 5/10 页 · 共 118 条
发布 3月23日
还有一份CS229的Cheat Sheet:https://stanford.edu/~shervine/teaching/cs-229/
发布 3月23日
一份spaCy的cheat sheet:http://datacamp-community-prod.s3.amazonaws.com/29aa28bf-570a-4965-8f54-d6a541ae4e06
发布 2月15日
ignite,来自FAIR的PyTorch high-level api,昨晚玩了一下非常好用,感觉是有点像keras和tf的关系。https://github.com/pytorch/ignite
发布 2月14日
前有StanfordNLP,又发现 https://github.com/zalandoresearch/flair 不过现在对这种轮子有点免疫。看了一些源码觉得项目代码写得还是挺不错的,自己造轮子的朋友不妨一看,看得多才能造得好。
发布 2月14日
早上试玩了一下JAX,前段时间有关注,昨天看Francois又在提到。简单来说就是Numpy+gradients,有XLA https://github.com/tensorflow/tensorflow/blob/master/tensorflow/compiler/xla/g3doc/overview.md 加成的GPU加速。想实现一些底层框架的话也许是一个不错的选择。https://github.com/google/jax
发布 2月14日
FAIR的ELF发布了ELF Go的新版,应该后面会继续发更多Go bot,https://facebook.ai/developers/tools/elf ELF OpenGo:https://research.fb.com/facebook-open-sources-elf-opengo/ lecun的fb post:https://www.facebook.com/yann.lecun/posts/10155789997817143
发布 2月13日
DVC:做data science model管理的工具,大致原理是使用git和s3之类的进行联合存储。多人团队,跨多业务团队还是蛮有用的,上一次和其他队员一起刷Kaggle的时候用过一次体验不错。https://github.com/iterative/dvc
发布 2月13日
来自Uber AI 的一个不错的轮子,玩了一天非常适合跑demo和验证,许多state of the art 的解决方案都可以先做验证。https://uber.github.io/ludwig/ blog介绍:https://eng.uber.com/introducing-ludwig/
发布 1月2日
2018年几个比较重要的数据集,自己用过 SQuAD2.0/CoQA/HotpotQA/TencentAI ML 质量都比较高 https://medium.com/syncedreview/2018-in-review-10-open-sourced-ai-datasets-696b3b49801f 还推荐 Tencent AI 前段时间发布的中文 embedding:https://ai.tencent.com/ailab/nlp/embedding.html
发布 1月2日
Parabel 的 Rust 高度并行实现。https://github.com/tomtung/parabel-rs 关于 Parabel:https://dl.acm.org/citation.cfm?doid=3178876.3185998 看起来是适合大规模分类问题,性能超群,留待日后研究。
发布 1月2日
一份对 FM 比较不错的应用介绍,包括推荐搜索这样的典型应用,适合了解 FFM 和 FM。https://www.m3tech.blog/entry/2019/01/02/090000
发布 11月27日
pandas bokeh 一个半年前准备造的轮子被人先造了,不过这种轮子也是不少了。。。 link: https://github.com/PatrikHlobil/Pandas-Bokeh