TGINSIGHT CHAT
Save The Web Project
@saveweb
TechnologiesThis channel can’t be displayed because it violated Telegram's Terms of Service.
Recent posts
Page 20 of 36 · 430 posts
Posted Feb 18
#丑搜 #搜索引擎 #博客 > 什么,你不知道“丑搜”?这是一个索引了 133k+ 篇中文独立博客文章的搜索引擎。 🤗 由于半年前的一次服务器存储告急,为了腾空间就把丑搜的全文索引数据库删了。于是丑搜宕了快半年了……咕咕咕。 昨天重写了后端以及工作流,又捡起 @jsun969 去年给丑搜写的“新”前端,改进了下让它再次上线,现在它不丑了.jpg。或许不能再叫它丑搜了。 https://search.saveweb.org * 加了查看快照的功能 * 可以实时更新数据库全文索引了(为防垃圾站瞬发投毒,暂不启用实时索引)…
Posted Feb 17
为了 STWP 不长期咕咕咕🌚,我们将每周发布项目进展简讯。 --- 第 14 周项目摘要。 20230401 ~ 20230403: @jsun969 在尝试给 uglysearch.othing.xyz 写前端:https://github.com/saveweb/saveweb-search-frontend 20230405: saveweb/review-2022 收录 +1 20230403 ~ 20230406: * 播客存档项目开工,写存档工具:https://github.co…
Posted Feb 8
画吧是于 2013 年成立的绘画 APP。其特色功能是用户上传作品到社区时,APP 会同时上传工程文件。浏览者可以播放工程文件,看到每一笔一画的作画过程(100%没有 AIGC)。 其已于 2024-02-09 00:36 关站。 说起来挺赶巧, 在 2023 年 11 月,@yzqzss 去海鲜市场捡了台红米6来插多余的两张电信卡开 WiFi 热点。 心血来潮把小米自带应用市场的“社交”排行榜里的 APP (不包含约会婚恋类)从上到下全安装体验了一下。 然后发现了画吧这个奇葩。API 竟然木有鉴权,登录获取…
Posted Feb 8
画吧是于 2013 年成立的绘画 APP。其特色功能是用户上传作品到社区时,APP 会同时上传工程文件。浏览者可以播放工程文件,看到每一笔一画的作画过程(100%没有 AIGC)。 其已于 2024-02-09 00:36 关站。 说起来挺赶巧, 在 2023 年 11 月,@yzqzss 去海鲜市场捡了台红米6来插多余的两张电信卡开 WiFi 热点。 心血来潮把小米自带应用市场的“社交”排行榜里的 APP (不包含约会婚恋类)从上到下全安装体验了一下。 然后发现了画吧这个奇葩。API 竟然木有鉴权,登录获取 jid(用户ID) 的时候有下发 token,且所有的 API HTTP 请求里都有 hbtoken 这个 field ,但是是置空的,后端不验证。 尝试过不同的渠道反馈这个问题,但官方一直没有回复。官方QQ群里的群友也说很难联系到客服。就不太对劲,然后我们一查,老板2023年上半年因为欠农业银行25万,被执行了(2023_苏0591执1084号之一.pdf),并且几个投资方也开始陆续撤股。生命体征很危险啊,必须给存上。 于是我们的爬网花了20多天把全部作品的元数据先全存了下来(彩蛋,一个爬虫节点还被主机商扬了)。在完成作品元数据爬取不久,2024-01-13 ,画吧宣布将于 2024-02-08 关站。 问题来了,画吧作品的工程文件和图片抽样预计总量 10~13TiB,绝大部分放在七牛OSS。而根据他们的一次运营事故,我们得以推算他们的 CDN 月回源用量可能不超过 150G。如果我们真的从公网下(0.26元/GiB),可能中途他们账上那点点余额就穿了。 (1/2) #画吧
Hashtags
Posted Feb 2
2023 年年中, KHTML 官宣倒闭。 KHTML 是 KDE 项目组研发的浏览器引擎, 是大多数现代主流浏览器的祖先。 https://news.ycombinator.com/item?id=39222757 https://en.wikipedia.org/wiki/KHTML 群友 #投稿
Hashtags
Posted Feb 1
https://linux.cn/article-16602-1.html 老王的“Linux 中国”宣布停止运营 我会在春节期间将 “Linux 中国” 所有发布的文章都打包成一份电子书,供大家收藏留用,所以大家不必自己用网络爬虫来抓取了。 --- 好的,AB 爬虫马上给你安排上。 [[abjob>35jlcjj78t5mdejz09dwt5mod]] #新闻
Hashtags
Posted Jan 29
# saveweb.org 域名的故事 saveweb.org 原本是一位名为 Fedor Sulyagin 的俄罗斯人创建的网页截图快照项目[1][2],但该项目自 2012 年后就无限期冻结(也许是资金原因),令人惊奇的是这个网站直到 2023 年域名过期前首页也一直挂着项目冻结告示[3],十多年诶! [1 - 项目介绍自述{俄语}] https://habr.com/ru/articles/114921/ [2 - saveweb.org] http://web.archive.org/web/…
Posted Jan 28
#迟到的新闻#互联网历史 有着二十三年历史的中文互联网活化石:诗生活网已于 2023年8月12日 关站。 我们现在才得到消息,所以没有提前抢救下来。
Posted Jan 28
#关站预警#脱水 我们注意到脱水 (http://www.tuoshuiapp.com) APP 在 2022 年后陷入了增长瓶颈,2023 年后社区活跃度大不如前,我们推测它现已处于停运边缘。 现在打开这个软件,会发现应用内的一些社区运营活动内容停留在 2022 年。它主页的“水星”功能区近 24h 只有 40 条动态,且有多条动态发布者是相同的(说明并不是筛选后的随机推荐,而是全站动态)。
Posted Jan 24
开机去咯。
Posted Jan 23
二〇二三年的年终总结都写好了吗? https://github.com/saveweb/review-2023
Posted Jan 23
更新: 我们现在准确预计需要从阿里云杭州内网拉 ~10TB 数据出来。 走阿里的 OSS 外网流出正价是 0.25元/GB,这意味着我们仅出网流量费就要花 2.5k 。 这实在是太贵了,所以我们在寻求其他更便宜的出网方法,如果你在这方面有经验,请帮帮我们。🫠 我们目前找到的一个方案是:(预计花费 700~1000) ——— - 将这 10 TB 数据在源站关站前先走内网(下载免费)传到阿里的 “深度冷归档OSS”(上传免费) > 一台轻量 2c2g 3m 99元/1年 (新用户仅需 61元/年),算下来一年能拉…