校内

做了个人人网的备份工具

总感觉哪天人人可能就不运营了,趁还能抓,先把能抓的抓到本地来,那些不管是牛逼还是傻逼抑或二逼的的过往,留着吧,偶尔看看也挺有意思的

项目在 GitHub 上:https://github.com/whusnoopy/renrenBackup,有问题可以在这里留言,或直接在 GitHub 上发 Issue 或 Pull Request

抓了状态、留言、相册和日志,以及对应的评论、点赞

其中点赞只有总数和最近的 8 个人的名单,受限没找到拿全量的接口,只能这样,翻状态发现 2014 年的时候就吐槽过只能看 8 个人点赞,当时还说有改版计划会看到全部,后来随着人人慢慢没落转型,应该也没人提这事了

评论看起来是人人本身就丢了一些,或者奇怪的隐私策略或怎样,总感觉漏掉一点,不过也尽力把人人按 API 给的对应评论和全站评论都保存了下来

状态应该漏掉早期的一部分,我只能抓到 2008 年左右的,更早的忘了是没有状态这个产品,还是就是数据丢了。状态有些是带图或带地理信息的,这部分都没抓,通过对于的 API 似乎也没拿到这些信息

分享的类型太杂,没有 json 接口,裸解析页面太伤了,暂时不打算做,后期如果有人一起或想起来再说

人人的图片大部分不允许跨域调,索性也爬到本地来,主要是照片和头像,然后照片的失真度比较大,有 EXIF 信息什么的也懒得爬了,毕竟这些不是重点

我的数据量应该只算一般,爬起来还没太大问题,那些量大类杂的,可能还会遇到新的坑,只能遇坑填坑

原校内日志迁移完毕

感慨: 本来我是一多么热爱生活的好少年啊, 结果活生生被憋成了愤青, 后来愤不动了就开始走技术大叔的路线, 偶尔装下人生导师

另外, 互联网上资源的生命周期实在是太短了, 迁移过程中想看看以前的一些转载, 结果原始链接点过去都失效了, 只有域名贩子的广告

每日愤一句:是中国人就不要***[1]

继续打 [1], 还是因为此类事情太多

记得很久以前有一个被广为转载的是, 校内被软银收购了, 所以现在校内是日本人的, 所以是中国人就不要用校内. 列出的理由包括爱国, 包括不能让个人信息泄漏给日本等等.

当然当时的事情发展的还是出现了一些好的观点, 比如校内那个淫荡无比的版权申明, 当然这也是该事件中为数不多的靠谱的内容, 要知道脑残们还是有分辨能力的, 只可惜他们的 buffer 都只有很小一段, 所以用仅有的一点真相填满 buffer 后, 剩下的就可以随便乱来, 再加点所谓爱国主义和民族主义, 哦哦哦, 我想起来了 05 年的春天全国各地浩浩荡荡的队伍.

扯远了, 先说爱国吧, 所谓应该支持民族产业, 这个 XXXX 事情, 除了国内那些国家垄断的, 似乎也都没几个是民族的了, 腾讯的大股东是南非的, 阿里的大股东也是软银(此消息未证实, 如有错误请指出, 同时不要拿这种标明了属于不确定的观点去恶意攻击), 百度么就不用说了, 至于新浪啊搜狐啊, 似乎也都是美国企业了? 做网游的也没几个吧? 如果真心爱国, 貌似都没法用电脑和上网了, 目前民用 CPU 也都是万恶的美帝的, 大多数人用的操作系统 (Win/Mac) 也都是万恶的美帝的, 浏览器也是美帝的, 不过据说国内有几家要做 WebKit 核心的非 IE 加壳了.

然后是个人信息泄漏, 嗯, 这的确是个事情, 不过如果真的想要获取信息, 貌似直接买数据比收购公司或者提高股份更方便快捷而且省时省力, 事实上网络上的所谓个人信息, 压根就不是隐私, 那些老大哥们, 无论是官方背景还是事实寡头, 无一不掌握有大量的个人信息, 更要命的私密信息更多是在电子邮箱吧, 或者手机上? 那要移动想干点啥? 还是 Eric Schmidt 说的好, 要想人不知除非己莫为, 两年多前能看到那些拥有海量数据的企业手里的数据时, 就对网络隐私彻底的没有想法了, 要想安全, 还是物理断网的好, 不过似乎自从人民摄影师陈冠希同学的事情那啥后, 更坚信了在读脑术出现之前, 只存在大脑里才安全.

今天思维比较乱, 大意是, 某些人会依据一点点确有其事的事实无限放大扭曲传言, 顺便加上一点让人热血沸腾的煽动, 群众就彻底激动了. (有没有觉得这句话很眼熟? 事实上大多数的 NC 都是这样的而已). 在本例中, 既有事实有 “软银注资千橡” 以及 “校内邪恶的版权声明”, 无限放大扭曲任选, 热血澎湃显然是永远不会过时的 “是中国人就***”.

我不想玩校内应用

还烦请大家不要一遍一遍的给我发邀请了, 很多我都是看过, 但是觉得没兴趣后卸载了的

PS. 校内有很多地方做的一点也不厚道, 比如好友买卖, 没安装应用的人为什么也可以被他人买卖并调戏呢? 这是一个需要参与的游戏, 没参与的人强行被拉进去, 有毛病
PS2. 如果大家真的无聊, 帮我看代码转文件吧, SUN 出的欠 SUN 的 Solaris 是这个世界上让人最不爽的操作系统, 没有之一

校内的统计绝对有问题

今天 zouyu 跟我说的, 我的页面一共就 488 个人看过, 怎么可能我前面那个帖子有 568 次阅读, 难道是可以只看帖不看页面的? 我那个帖子还有哪里可以找到入口呢? 或者帖子阅读次数是可以重复计数的? Q-zone 都是按人算而不是点开次数算的…

校内是个不错的 idea, 但是技术确实还很值得改善, 也许, 可以会成为中国的 myspace 之类, 毕竟, 拥有一个庞大用户群是可怕的, 特别是其中很多人还比较活跃的情况下.

— 迁移时补注 2011/12/04 —
上述内容原文发在 http://blog.renren.com/blog/30314/241062490, 后面有一些就此问题的讨论