Recent posts
Page 53 of 84 · 1,002 posts
Posted Aug 19
https://www.bilibili.com/video/BV1FTYhzREri/
Posted Aug 19
大的要来了 https://x.com/kenn/status/1957583873761767857
Posted Aug 19
Qwen-image-edit 不赖
Posted Aug 19
https://www.zhihu.com/question/488265003/answer/1938435374528567133
Posted Aug 19
通义千问图像编辑模型Qwen-Image-Edit发布 通义千问Qwen宣布推出Qwen-Image-Edit模型,Qwen-Image的图像编辑版本。该模型基于20B的Qwen-Image模型进⼀步训练,成功将Qwen-Image的独特的文本渲染能力延展至图像编辑领域,实现了对图片中文字的精准编辑。此外,Qwen-Image-Edit将输⼊图像同时输⼊到Qwen2.5-VL (实现视觉语义控制) 以及 VAE Encoder (实现视觉外观控制),从而兼具语义与外观的双重编辑能力。用户可以访问 Qwen Chat 并选择“图像编辑” 功能进行体验。在多个公开基准测试中的评估表明,Qwen-Image-Edit在图像编辑任务上具备SOTA性能,是强大的图像编辑基础模型。 —— Hugging Face
Posted Aug 18
https://x.com/rxliuli/status/1957333500836843700
Posted Aug 18
这次轮到 Kong 的 Hackathon 活动了!🦍 总计 $10000 的奖金池,无论是个人或者 5 人以内的队伍都可参赛。主题也很直接,这是完全在线的活动,所以无论你身在哪儿都可以报名参赛,只要在规定时间内提交最终项目即可 👏 欢迎大家来一起瓜分奖金 😁 报名地址: https://bit.ly/kongAI
Posted Aug 17
GLM-4.5V Spatial Reasoning (CAPTCHA) 没想到 ZAI 的这个模型推理速度竟然这么快,在空间推理任务上 disable thinking 几乎没有损失。 关闭推理的情况下,一个任务 3~5 秒就跑完了,这是一个相当离谱的速度。推理效果与 GPT-5 Medium ~ High 相当,目前测的示例还不够广泛。从稳定性上,GLM-4.5 V 要强过 GPT-5。 需要注意 GPT-5 reasoning_effort 开到 medium 耗时基本 40s 起,high 耗时 85s 起,差异显著。 https://github.com/QIN2DIM/hcaptcha-challenger/blob/main/docs/010.oai_spatial_reasoning.ipynb
Posted Aug 17
GPT-5 Spatial Reasoning (CAPTCHA) https://github.com/QIN2DIM/hcaptcha-challenger/blob/main/docs/009.gpt-5_spatial_reasoning.ipynb
Posted Aug 17
我是真绷不住了,看着 OpenAI 的官方文档写一个 image_input 的示例,结果写到后面发现,这个 SDK 用法竟然不支持 “structured output”?
Posted Aug 17
首届世界人形机器人足球赛落幕,中国队战胜德国夺冠 全球首个为人形机器人组织的综合性赛事——2025 世界人形机器人运动会于 8 月 17 日在北京落幕。在备受关注的足球 5v5 决赛中,清华大学火神队以 1:0 战胜德国 HTWK Robots + Nao Devils 队,夺得冠军。据央视报道,5V5 足球比赛全程由 AI 算法自主控制,无需任何人工操作,10 台机器人在绿茵场上自主完成抢断、传球、射门等连贯动作。在另一场 3v3 决赛中,中国农业大学山海队同样击败了德国 Sweaty 队。 IT之家 🍀频道🍵茶馆📮投稿
Posted Aug 17
【邓紫棋劝你别读博】 https://www.bilibili.com/video/BV1duYizZE5c/?share_source=copy_web&vd_source=5565a69a1d274a1f750380ce5e6c9386