Post content
大家帮个忙,献祭下自己 Google 账号这个月的 Google BigQuery 的 1TiB 免费查询配额,帮我们把 GitHub 上杂七杂八的地方出现的 goo.gl 链接提出来。 1. 登录 https://console.developers.google.com/ 2. 创建一个项目 https://developers.google.com/console/help/#creatingdeletingprojects 3. 激活 BigQuery https://developers.google.com/console/help/#activatingapis 4. 看协作文档 https://pad.notkiska.pw/p/bigquerygoogl ,挑个还没查的日期范围。 5. 执行下面的 SQL 查询,并导出 JSON,然后把 JSON 文件名适当重命名后发到群里。然后打叉表示处理完了。 查整年(以 2011 年为例): SELECT URL FROM ( SELECT REGEXP_EXTRACT_ALL(payload, r'goo\.gl\/[0-9a-zA-Z\/]{4,256}') AS URLS FROM `githubarchive.year.2011` ), UNNEST(URLS) AS URL WHERE ARRAY_LENGTH(URLS)!=0 查某年的月份区间(以 2019 年 01 月到 06 月为例) SELECT URL FROM ( SELECT REGEXP_EXTRACT_ALL(payload, r'goo\.gl\/[0-9a-zA-Z\/]{4,256}') AS URLS FROM `githubarchive.month.2019*` WHERE _TABLE_SUFFIX BETWEEN '01' AND '06' ), UNNEST(URLS) AS URL WHERE ARRAY_LENGTH(URLS)!=0 协作: https://pad.notkiska.pw/p/bigquerygoogl