TGTGInsighttelegram intelligenceLIVE / telegram public index
Back to channels
DPS Build avatar

TGINSIGHT CHAT

DPS Build

@dps_build

Technologies

AI, coding, data science and startups

Subscribers713Current channel subscribers
Tracked posts603Indexed post count
Recent reach5,586Sum of recent post views
Recent posts

Recent posts

Page 29 of 51 · 603 posts

Posted Nov 28

https://fxtwitter.com/awesomevisahq/status/1729302044593512496 https://fxtwitter.com/awesomevisahq/status/1729302650284642738

413 views

Posted Nov 25

DPS 周刊 124 - ImageNet 的艰难诞生 https://letters.acacess.com/weekly-124/ 在上一期 DPS 周刊中,我们介绍了李飞飞教授的移民奋斗史 -- The Worlds I See 。其实她的成名之作当属 ImageNet,这座计算机视觉的里程碑的诞生却一波三折,它甚至差点夭折。 当李飞飞最早和身边的人聊起 ImageNet 的点子,很多人都觉得她异想天开,甚至包括她的祖师爷 Jitendra Malik: He paused for a moment, then continued. “Frankly, I think you’ve taken this idea way too far.” I took a shallow breath. “The trick to science is to grow with your field. Not to leap so far ahead of it.” 幸好李飞飞遇到了 Kai Li 教授,以及他的学生 Jia Deng。专注于分布式计算的他们帮助李飞飞解决工程上的难题,毕竟在当年要构建一个包含上百万张图片的数据集,工程上并不容易。 最早他们是请学生一张张搜索图片,然后手工下载。Jia Deng 计算了一下工程量之后,发现要19年才能下载完。于是他写了爬虫,自动从 Google 上检索图片,然后下载。不久这个爬虫就被 Google 封锁,直到他使用动态 IP 来破解 Google 的封锁。 解决了图片下载的挑战之后,如何标注这些数据是第二大难题。在与 Jia Deng 的闲聊中,另一名研究生 Min 得知了这一挑战,于是向李飞飞建议使用 Amazon 的众包服务 -- Mechanical Turk -- 将标注工作外包给全世界使用 MTurk 的人。 I instantly forgot about my haste as my ears perked up. Jia has a social life? 就这样经过两年不懈的努力,ImageNet 终于完成建设,包含了近1500万张图片。 After two more years on the knife-edge of our finances—an agonizing stretch in which even a minor bump in the road might have sunk us for good—ImageNet was finally maturing into the research tool Jia and I had always envisioned. 恰逢 Black Friday,我们开通了首年订阅优惠,只要75折。点此获得优惠 他们于2009年将论文 ImageNet: A Large-Scale Hierarchical Image Database 投向了计算机视觉的顶会之一 – Conference on Computer Vision and Pattern Recognition (CVPR),没想到只获得了海报展示的机会。你能相信吗?这篇计算机视觉史上最重要的论文之一只获得了海报展示机会,而不是口头汇报的机会? Our first setback was also the most consequential: that ImageNet was relegated to a poster session. 尽管在 CVPR 2009 上,ImageNet 并没有获得多少关注。但是李飞飞他们并没有气馁,相反,她非常坚信自己的成果: “I don’t think ImageNet will make today’s algorithms better,” I said. “I think it will make them obsolete.” 他们也没有雪藏这个数据集,而是把他们做成了一个挑战赛,任何人都可以报名参加。于是他们联合之前的赛事 PASCAL VOC,让 ImageNet 成为其中的一个分支。 Mark was a rising star in the world of computer vision in his own right, and kindly allowed ImageNet to begin its life as a new track within the PASCAL VOC competition, then in its sixth year. It was an especially gracious offer, giving us the chance to learn the ropes within the confines of something already established. 当然“古早”的机器学习算法 -- 比如随机森林,支持向量机等等,拿这么大的数据集毫无办法,所以参赛者也知难而退: Worst of all, participation was already dropping, and precipitously: registrations fell from 150 to 96 in the second year, and the entries themselves fell from 35 to just 15. 一直等到2012年, Alex Krizhevsky,Ilya Sutskever 和 Geoffrey Hinton 三人利用基于神经网络的 AlexNet 把 ImageNet 上的识别错误率降低到 15.3%,比第二名高出10.8%。以至于李飞飞和 Jia Deng 都不敢相信自己的眼睛。因为神经网络在当时被视为古早的算法,很多机器学习的教材都是一笔掠过 :) “All right. Well, first of all, they’re using a really unorthodox algorithm. It’s a neural network, if you can believe it.” My ears perked up even more. If he didn’t have the entirety of my focus a moment ago, he certainly did now. “It’s like … ancient.” 当然 Hinton 知道 ImageNet 也纯属巧合。因为神经网络早已被人摒弃,只有他一人在默默坚持。当时的他苦于找不到足够大的数据集测试自己的算法,知道有一天他向老朋友 Jitendra 抱怨,而 Jitendra 向他提起了 ImageNet。没错,就是前面心存怀疑的祖师爷。 “You really want to impress me, Geoff? Show me they can handle something serious.” “Like?” “Like object recognition. In the real world.” Whatever Jitendra thought about ImageNet, I’d known since my days at Caltech that he was a believer in the power of visual categorization. “Have you tried PASCAL VOC?” “Yeah. No luck. It’s just too small. There aren’t enough examples, so the network doesn’t generalize very well when we show it something new.” “All right, so you need something bigger. Have you been following Fei-Fei’s lab, by any chance? When you’re ready for a real challenge, take a look at what they’re up to.” 所以 ImageNet 和 AlexNet 相辅相成,没有 ImageNet 这么大量的数据,AlexNet 就不会有惊人的突破;没有 AlexNet 的问世,也就没有 ImageNext 的广为人知。而之后的一切都是人们所熟知的历史。 现在回看,ImageNet 真是命运多舛,哪怕李飞飞少一点坚持,那么整个计算机视觉的发展速度都会不一样。

374 views

Posted Nov 25

https://x.com/itsandrewgao/status/1728176453634981911

369 views

Posted Nov 24

Daily Productive Sharing 855 - Abstraction Paul W. Homer 认为抽象机制是编程中最重要的机制之一: 1 抽象机制可以让你的代码减少错误,提高你的编程效率,最重要的是降低你的认知负担; 2 你可以让你的代码慢慢变得抽象,并不一定要一步到位,但好的代码是在不断进化的,而抽象恰好是进化的标志之一; 3 代码是一个程序员的认知体现,所以写代码之前读一些相关的文档,请教一些有经验的人,会让你事半功倍; 4 写代码本身也会面临不少取舍,而你要做的就是根据实际情况,做出平衡。 https://letters.acacess.com/daily-productive-sharing-855/

376 views

Posted Nov 21

The Information 报道不少 OpenAI 的高级研究员也辞职了 https://fxtwitter.com/jon_victor_/status/1725766733225656499?s=46

430 views

Posted Nov 19

没想到 ImageNet 的开发也是一波三折,几经夭折。 它的出现和 AlexNet 相辅相成,没有 ImageNet 这么大量的数据,AlexNet 就不会有惊人的突破;没有 AlexNet 的问世,也就没有 ImageNext 的广为人知。 下一期周报,我们会详细介绍一下 ImageNet 的诞生过程 https://t.me/tms_ur_way/3019

440 views

Posted Nov 18

The Information 报道不少 OpenAI 的高级研究员也辞职了 https://fxtwitter.com/jon_victor_/status/1725766733225656499?s=46

432 views

Posted Nov 18

Sam Altman 被 OpenAI 开初 各方的反应很奇妙: Sam 本人的表态中规中矩:https://fxtwitter.com/sama/status/1725631621511184771 创世 CTO,时任董事会主席的 Greg Brockman 被转岗回 CTO,结果 Greg 直接请辞了: https://fxtwitter.com/gdb/status/1725667410387378559 Google 前CEO — Eric Schmidt 夸 Sam 是个英雄 htt…

967 views

Posted Nov 18

Sam Altman 被 OpenAI 开初 各方的反应很奇妙: Sam 本人的表态中规中矩:https://fxtwitter.com/sama/status/1725631621511184771 创世 CTO,时任董事会主席的 Greg Brockman 被转岗回 CTO,结果 Greg 直接请辞了: https://fxtwitter.com/gdb/status/1725667410387378559 Google 前CEO — Eric Schmidt 夸 Sam 是个英雄 https://fxtwitter.com/ericschmidt/status/1725625144519909648 连硅谷老牌记者 Kara Swisher 都不知道发生了啥,不过她开始追踪这事了,非常精彩 https://x.com/karaswisher

442 views

Posted Nov 11

最简易的 MVP 突然想到可以利用笔记工具的网页发布功能做一个最简易的 MVP。 这一方法有几大好处: 1. 快速验证想法,全部创建时间不到五分钟; 2. 可以使用 Stripe 的后台管理用户,统计付费情况,获得邮箱; 3. 如果没有 Noteplan,也可以使用其他带发布网页功能的笔记工具,比如 Notion 等等。 https://noteplan.co/n/2D8C88BB-BB13-4F65-A84A-03C7C9DAA2F9 另一个 demo 在此 — 如何获得荷兰的30%税收优惠:https://noteplan.co/n/465E4ADB-13C9-483D-AC81-5C3BE91CA54E

488 views

Posted Nov 11

最近在看电商平台的机制,类似淘金币的设计真是一笔空手套白狼的好买卖。 1. 对于消费者而言,只要通过签到等方式就能获得淘金币,感觉像是平台的打赏; 2. 对于卖家而言,参与淘金币的活动“可以增加”曝光量,“可以吸引”更多用户; 3. 等到卖家结算流水的时候,发现所有淘金币的成本都出在自己身上,平台啥都没成本都没有。 4. 更夸张的是,参与淘金币可以设置抵扣比例和上浮空间。比如说100元可以抵扣2%附加40% 的上浮空间。 什么意思呢?如果用户拥有超过这2%的淘金币,那就抵扣2%,然后都扣在商家头上;如果用户持有的淘金币不足以抵扣这2%,用户使用的时候,商家还要追加40%。比如用户只有抵扣1%的金币,并且要求抵扣,那么商家承担的就是 1.4% 的成本。 这个游戏里,用户通过付出时间,付出专注而获得了蝇头小利;商家承担了所有的成本。只有平台获得了最大利益。 想出这个方案的产品经理真是个天才。

447 views
12•••5•••10•••15•••20•••25•••2728293031•••35•••40•••45•••5051