人人

人人网备份工具终于算个活跃的 GitHub 项目了

人人网社交资产真的卖给了多牛所致,renrenBackup 这个项目在 GitHub 上很快多了好多 star(也是自己跑到人人和 v2ex 上安利了一波),也有人提 issue 和 PR,这样也挺好,项目有人用有人吐槽,才算一个合适的项目

开心的是

  1. 自己做的东西有人用,能帮到人,这是做技术的人最开心的吧
  2. 有更多奇怪的边界条件被挖掘到,从而增强项目健壮性
  3. 有人帮忙提 PR,主动帮忙处理边界条件

好气也好笑的有

  1. 各种无脑提需求或试图引入各种第三方库来实现某些功能的,我都各种努力把 BeautifulSoup 和 pyquery 给从依赖去掉,你还要我加回去?目标还是能尽可能的简单的运行起来,我还想做 .exe 的版本给 Windows 用呢
  2. 人人改过登录逻辑,不用每次都取加密 key 了,在撞上验证码时无法正常工作。修复前还跟人争了半天,不过之前那个取验证码的逻辑也写的有问题,多取了一次
  3. 真的是各种意想不到的脏数据
    • 评论里有用户已经销号,有字段缺值,返回的 json 都是不合法的
    • 相册加密,能看到里面的张数但是打不开
    • 抓别人的留言板遇上留言板不公开,第一页都打不开

比较不高兴的有

  1. 提问题像大爷一般,好像欠着他什么一样的口气,我做这个又没收你钱,做着玩的东西,大家有问题一起好好分析,能解决去解决,不能解决把问题复现步骤更明确的给出来让有能力的人去解决就好,谁也不欠谁

做了个人人网的备份工具

总感觉哪天人人可能就不运营了,趁还能抓,先把能抓的抓到本地来,那些不管是牛逼还是傻逼抑或二逼的的过往,留着吧,偶尔看看也挺有意思的

项目在 GitHub 上:https://github.com/whusnoopy/renrenBackup,有问题可以在这里留言,或直接在 GitHub 上发 Issue 或 Pull Request

抓了状态、留言、相册和日志,以及对应的评论、点赞

其中点赞只有总数和最近的 8 个人的名单,受限没找到拿全量的接口,只能这样,翻状态发现 2014 年的时候就吐槽过只能看 8 个人点赞,当时还说有改版计划会看到全部,后来随着人人慢慢没落转型,应该也没人提这事了

评论看起来是人人本身就丢了一些,或者奇怪的隐私策略或怎样,总感觉漏掉一点,不过也尽力把人人按 API 给的对应评论和全站评论都保存了下来

状态应该漏掉早期的一部分,我只能抓到 2008 年左右的,更早的忘了是没有状态这个产品,还是就是数据丢了。状态有些是带图或带地理信息的,这部分都没抓,通过对于的 API 似乎也没拿到这些信息

分享的类型太杂,没有 json 接口,裸解析页面太伤了,暂时不打算做,后期如果有人一起或想起来再说

人人的图片大部分不允许跨域调,索性也爬到本地来,主要是照片和头像,然后照片的失真度比较大,有 EXIF 信息什么的也懒得爬了,毕竟这些不是重点

我的数据量应该只算一般,爬起来还没太大问题,那些量大类杂的,可能还会遇到新的坑,只能遇坑填坑

三年又三年

之所以想起这个题目, 一是受无间道里梁朝伟跟黄秋生吐槽 “说好的三年, 结果三年又三年, 三年又三年” 和 “再见警察” 那个悲凉的音乐影响 (只是无厘头的觉得三年确实可以算一个比较合适的 checkpoint 而已, 相关曲目请见 http://www.xiami.com/song/1769154348), 二是的确最近的每个三年都是大阶段变化, 三年前的三年前的三年前, 离家上大学, 三年前的三年前, 第一次出来实习, 后面也基本没太多在学校混, 三年前, 毕业工作, 现在的这个三年, 离开北京到杭州, 基本上又是一个全新的开始

上一次确实也写了一篇三年 http://www.yewen.us/blog/2010/07/%E4%B8%89%E5%B9%B4/, 那这次也还是对比着写写看

2007.7.18 星期三 北京 晴
2010.7.18 星期天 北京 晴
2013.7.18 星期四 杭州 晴
*
2007.7.18 百度实习入职, 第一次实习
2010.7.18 在百度工作, 第一份工作
2013.7.18 已从人人离职但还没在阿里入职, 换了个城市
*
2007.7.18 百度网盟, 第一次接触互联网广告, 从此一条路走到黑
2010.7.18 百度凤巢, 那段时间比较顺手, 后面有两次被坑到不行, 感觉自己的离开也还是跟这有关系
2013.7.18 未知的方向, 重装上阵的阿里妈妈? 当年的友商, 现在自己也混迹其中, 而前东家是友商了
*
2013.7.18 过去的三年, 在西二旗十六个月, 在柳芳二十个月
2013.7.18 看起来会在杭州呆很久, 很可能就一直在这了?
*
2007.7.18 在学校阿排还是被叫的最多的名字
2010.7.18 更多扮演的角色是恶趣味无聊理工男
2013.7.18 可能又要回到天天被叫阿排的日子?
*
2013.7.18 过去的三年, 搞过搜索广告, 也搞过展示广告, 也从广告退出来去折腾用户产品相关的, 最后绕了一大圈, 还是回到广告, 在赚钱的部门, 有压力有动力倒也不是坏事
2013.7.18 在百度被希望转 manager, 结果好像 tech/manager 都没做好
2013.7.18 在人人倒是因为下面挂了一堆人而被动变成了 manager, 也被各种培训, 换个角度看问题思路会开拓很多
2013.7.18 离开一线心里还是发慌, 自己这种闲散的心态去带人没法给小弟抢地盘, 人再好也还是白搭, 还是走技术线吧, 能管好自己已经很不错了
2013.7.18 很感谢这些年碰到的各位导师, 同事, 都很赞, 只是可惜自己不够成器
*
2010.7.18 想尽办法跟妹子在一块
2013.7.18 还是想尽办法跟妹子在一块
*
2013.7.18 Good Luck

试了下 Win8 Custom Preview

大约半年前试过 Win8 的 Develop Preview, 当时就图个乐看了下, 没什么 metro 的应用, 传统 win 应用也没发现 win8 上用起来比 win7 爽的任何地方, 装好后就再没用过.

等 Win8 Custom Preview 发布, 看了下发布记录都是一片赞扬, 想 DP 算 beta 的话, CP 应该是 RC 了? 之前用 Win7 时, 就是 Beta 还很多小毛病, RC 开始用的非常爽, 果断跟进 Win8 看看.

昨天早上起来开旋风, 加离线任务, 用离线加速先扒到服务器上, 早上在家拖了一个多小时还没拖完, 4M 的网还是不够快, 晚上公司没什么人时下完, 用微软的 Windows 7 USB DVD Download Tool 刻到 U 盘上, 拆出淘汰下来的一个笔记本硬盘, 全新安装.

Win7 USB DVD Tool 官网地址太难找, 给个天空的链接吧 http://www.skycn.com/soft/57523.html
Win8 简体中文 32bit 旋风离线地址 http://url.cn/4C3m9c
Win8 简体中文 64bit 旋风离线地址 http://url.cn/1uTrBq

机器配置: ThinkPad X200, P8700 (2.53G, 2C/2T), 4G, 100G (7200rpm), GM45

感觉不到十分钟就完成了安装过程, 开始配置, 发现没抄序列号, 而且不像 Win7 可以先跳过去, 进系统后再配. 好吧, 拿手机一搜, 直接在搜索摘要里就看到, 所有语言所有版本都一样的: DNJXJ-7XBW8-2378T-X22TX-BKG7J

相比之下配置过程显得更慢, 绑定了 Microsoft Account (就是以前的 Live 帐号), 把头像等个人信息都拖了下来, 机器密码也是那个帐号的了, 并按提示输手机号好找回密码 (这就真是大杀器了). Gmail 内立马就收到两封邮件说绑定了手机号和新的设备名.

随便瞄了下, 和 Develop Preview 没啥变化, 某些细节做的更完善一些, 整体来看变化不大. Metro 下原生的天气, 地图, 股票等几个应用都被提示不在我所在地区的电子市场提供, 你妹的不提供你放桌面上干啥, 而且我去电子市场强制下载后还是跟我提示一样的错误, 明明后面真正的内容都出来了, 错误框挡得住操作挡不住显示啊. 电子市场现在还是没多少东西, 不知道是不是因为我装的中文系统外加把地区选成了中国, 游戏稍微多一点, 社交就只有 WordPress.com, 人人, QQ 三个.

Metro 下很多快捷键和手势果断还是需要有个简单教程的, 微软这个魂淡以为大家都是神仙自然就会了么? 我看了那么多发布会和试用记录, 没几个有手势教程的. 由于笨狗也没学会, 所以就不写教程误导群众了. 只知道 Metro 下按住大概标题栏那个位置, 拖屏幕左边是锁定在左侧, 拖右边是锁定到右侧, 锁定后拉分割线可以恢复全屏, 点右键呼出 Metro 应用的菜单, 按住标题栏往下拖是关闭应用 (不然按 win 键退出时只是把应用挂起), 鼠标停留到左下角可以呼出类似传统开始按钮的一个 Preview 界面, 鼠标停留到左侧可以看到最近打开且挂起在后台的 Metro 应用, 鼠标停留在右下角可以让右侧滑出一个操作面板, 可以进行所有应用搜索, 配置面板什么的.

很多发布会记录上说的流畅度笨狗完全没感觉到, 虽然这个机器配置是挫了点, 但是 CPU 和内存应该都是扛得住的, 只有可能是硬盘在拖后腿 (07 年买的希捷 7200.2 100G 盘, 现在随便一个大点的 5400rpm 盘都能秒杀他, 更别说微软官方演示用的 SSD 了), 而且打开任务管理器, 发现有几个系统服务非常吃 CPU, 平均有 1/3 以上是被系统服务吃掉的.

下了原生的 Cut The Rope (割绳子) 玩, 跟之前发布到 IE9 上的一样, 没什么新意. 系统自带的弹球大炮倒是变成真 3D 了, 只发现左右 Ctrl 是下面的挡板, 没找到发射和其他控制键, 球自己出去的, 而且 3D 太花了看不太清 :( 就跟我看魔兽 3 跟星际 1 的感觉一样. 下了原生的人人和 QQ, 其中人人能登陆进界面, 但是界面非常不友好, 很多留言看不全, 回复只能回楼主不能回具体的人, 等等等等各种不爽, 果断还是换用浏览器上了, QQ 更是连好友列表都刷不全就卡那不动了, 屡试不爽, 从没成功过. 装传统界面的 Chrome, 发现更喜欢 Chrome 渲染出来页面布局字体效果. 自带的输入法经常自作聪明切到中文, 按 shift 切换中英文有点小不习惯, 虽然现在写东西本来就是开着中文输入法也用 shift 切, 装 QQ 拼音纯净版, 很疼的发现很多程序默认就是中文模式的输入法了, 找了半天还找不到怎么改成默认英文.

播放音乐的有传统界面的 Windows Media Player 和 Metro 下的音乐, 这俩居然没法统一, 经常一点就变成了两边一起放. Metro 的音乐 Collection 似乎要联网? 而帐号又提示没登上去, 到底是天朝本身就被无视了, 还是 GFW 干的? Metro 界面的音乐没找到怎么建播放列表, 只能单曲播放, 疼…

晚上折腾完后关机, 之前看过说开机快关机慢, 看半天没灭就直接睡觉了, 结果早上起来还没关掉, 怒啊, 按电源键, 进入休眠了, 唤醒, 解锁, 输完密码后卡死了, 再休眠, 唤醒, 解锁时想了下直接关机吧, 这次倒挺快, 小几秒就熄了. 重新开机关机就很快了, 而且好像系统服务非常吃 CPU 的现象也有所缓解, 你这是要闹那样啊.

早上关了 Win8 后把硬盘拆出来, 插回之前的硬盘, 正常回到 Win7 下来工作, 周末如果有空再折腾看看. 总结: Win8 现在基本还是不可用状态. Metro 下的应用太少, 很多都不能用, 能用的很多也都不靠谱. 如果不用 Metro 界面, 没发现传统界面比 Win7 有多大优势 (资源管理器的 Ribbon 界面有点用, 但是也没有非常有用), 那为啥不直接用 Win7?

2011 年度盘点

按惯例每年写一篇总结, 记录自己的过去, 碎碎念兼反思得失. 下面基本按时间序来说说不同角度的大事

元旦回家, 一个人的春节

避开春节的火车, 选在元旦回家, 家里人基本都在, 该吃吃该睡睡几天也就过去了, 不用像过年一样大把时间都耗在各种走亲戚上, 经常像个小孩一样腻着爸妈, 晚上一起烤火打牌, 随随便便什么都聊下, 也挺好的

过年一个人在北京过, 年前几天和年后才上班的几天公司都冷冷清清的, 没怎么干活, 在做一些自己的小爱好什么的, 其实跟休假差不多. 过年那几天提前把一些吃的屯好, 最后过的倒还行. 装上三国志 11 在这几天通了一次 (应该是简单模式), 也重新回顾了下那段历史, 好像就这段时间把三国演义的小说好好看完了. 期间去了趟地坛庙会, 跟我想的庙会还是有很大落差, 就一游乐场嘛

换室友, 换房子

在西二旗租的房子的前室友 sandy_sp 因为个人原因, 离开北京去了上海银联, 一个听起来很操蛋又很有米, 偶尔想想也很悠闲很爽的地方, 所以室友换成了 boluor. 跟 boluor 还是经常会在晚上扯技术问题, 本来都打算要睡的两个人穿个裤衩站各自门口就一些系统问题扯上一两个小时, 再看下时间不早还是快去睡觉, 第二天还要干活. 后面我走了后 boluor 不无遗憾的说现在没人跟他扯这些了, 只能自己闷头看书, 我好像也觉得现在这个状态并不是非常好, 很多跟人学习的过程是一个隐性的, 要时刻注意

因为换工作的关系, 也因为想离 MM 更近点, 从西二旗那搬来了柳芳, 从 13 号线的那头到了这头. 新房子就在公司对面, 早上上班只要几分钟, 大部分时间还耗在等电梯和等红绿灯上了. 这边更市区一些, 买什么或办点什么事都要方便不少, 生活方式略有变化, 不像在西二旗只能窝家里或公司, 出门就奔上地华联. 新房子有新室友, xenplus, 也是武大集训队的师弟, 在公司的同事, 把我忽悠过来的这只鱼, 不过好像因为在这边和 MM 在一起的时间更多点, 所以都缺少些技术讨论和同步成长? 因为买菜什么的变方便, 所以开伙频度明显增加, 自己厨艺只是略有进步, 某喵倒是越来越强

不那么顺利的工作, 坑爹的事故

上半年做了件大事, 中间因为一个诡异的问题把整个进度拖慢了不少, 但是没等最终好好做完就被大老板整个拍掉. 唉, 总是抓不准做事的时机, 而且坑爹的诡异问题经常被自己撞上, 不知道该自嘲运气实在有问题, 还是自夸做的多也容易错的多? (那个诡异的问题和交换机的 buffer 设置有关, 会导致服务器超时不一致, 但是这种事情谁想的到谁有权限控制啊) 整个过程中因为自己的疏忽和流程的漏洞, 弄得有连着两周都在出各种事故, 后来自己都没法忍了写事故通报时都不知道到底该怪谁

上半年做了另一件自己认为很有意义, 但实际上几乎没有任何老大认可收益的事情. 虽然自己坚持这件事的意义重大, 而且很多还在一线的同事也认可, 但是, 有些东西, 老大说没意义就是没意义, 或者就算老大想认可但评估体系没法考量那这事就是没意义的, sigh

用 Markdown 做基础维护了一个类 wiki 的分享站 ourfcr.info, 帮了不少人, 但是也因为纯属个人爱好和没做好协同编辑, 其实也只是一个人在做. 那一段每天早上六七点到公司, 干这事到九点等大家来了再切回正常工作状态的日子, 是个人习惯和工作效率都很高的一段时间, 很舒服很充实, 后期很多有心无力和懒得搞也慢慢荒了, 现在离职后那个内部站自己都看不到, 索性也算断了这个念想, 不怀旧, 也欺骗自己不愧疚

七月去业务一线实习了一段时间, 从另一个角度看了很多不一样的东西, 颠覆了很多认识, 也有很多想法, 但最后, 却发现大部分事情还是无能为力去改变. 特别是后续的工作方向又发生大变, 正如离职时的告别邮件里说的, 很多未竟的梦想和许诺, 实在抱歉, sigh

在八月还是九月的某个时间, 突然就觉得做的事情真的没意思了, 而且从前面的很多记录都以叹气结尾就知道工作认同感是怎样, 之前的一些不爽和念想就变成了 “我要换个地方看看不一样的活法”, 这直接导致了离职. 这期间本来想作收尾工作的一次小流量, 最后还莫名其妙的出了持续两周的事故, 又是坑爹的诡异问题导致, 真心无奈, 彻底无奈 (这次的问题是持续集成的编译机群新增了一台, 系统环境不一致造成, 又是莫名其妙的不可控也压根想不到的问题)

换工作

十一月初从百度凤巢广告系统策略离开, 到人人来做人群定向, 做事有一定的延续性, 也有挺大的改变. 目前来看一切都还算好玩, 不一样的数据, 不一样的应用场景, 有很多不一样的东西要去学习, 也有很多不一样的坑可以刨

虽然从百度走了, 但是感觉很多时候还是在用百度的方式在思考问题, 跟以前的同事 (同时也都是很好的朋友) 都还保持很好的联系, 让很多人都吐槽 “好像你从来就没走过一样”. 最后几天很 ws 的跑回去参加以前组的年终聚餐, 本只想跟大家聚聚, 然后就一些不涉及两边公司机密的纯技术问题进行下探讨, 最后倒变成了纯混吃 + 恶意占用抽奖 quota, 太损 RP 了

跟大家聊一些技术点的时候, 明显还是能感觉到两边的整体成熟度有很大差异, 人人这边是更年轻更无畏的另一种风格, 其实很像几年前的百度, 没有太多人可以教你, 要你自己学习自己进步. 当然, 人人这边很多事情本身也是在做开拓性的工作, 没有参考也正常

工作环境变朴实了很多, 有些落差, 不过基本上还不影响干活本身, 今天去看了下很快要搬过去的新工作区, 希望继续跌落, 这还是朴实路线啊 (我很厚道的忍住了吐槽没用贬义词, 但是没忍住要加个括号吐槽下) 唯一让我还是觉得不甚喜欢的就是人人跟国内大部分 IT 企业一样, 会有很黄很暴力的氛围, 关于这个, 我准备单独写篇博文讨论下, 草稿和框架已经有了

各项游玩

春天的时候跟槽群的朋友一起射箭, 好玩. 去植物园, 除了天气和交通比较坑爹, 其他都还很赞, 只是大家打 UNO 的兴致没那么高了

小组内组织去开卡丁车, 磕磕碰碰的上手, 意犹未尽的离开, 速度感带来的刺激果然是男生的本能追求. 多的票后来又跟 MM 一起偷偷去了一回

每年一度的大 bui, 凑上 FC2.0 的人一起去的坝上, 想起 07 年都可以组织整个 ECOM 的大 bui, 现在光是 FC 检索端就要两辆大巴, 扩张真快. 草原没有想的那么漂亮, 被牵着走的骑马也挺没劲, 只有回来路上马被别的马惊了下时跑了两下算是比较 high 的体验. 没在草原玩坑爹的游乐设备后面被证明是明智的选择, 跟着老万一起去开的四轮摩托, 在草原上跑的煞是惬意. 长期不晒太阳, 出去随便晒了下背上就脱皮了, 这还是穿了衣服的保护呢

秋天小组 bui 去打了趟高尔夫, 在室内对一块练习场挥杆的那种, 运动细胞还是不咋的啊, 完了不出意外全身酸痛好几天

终于去了趟颐和园, 也去了趟天坛, 想想在北京还有挺多地方没去的, 故宫, 后海, 798, 十三陵, 虽然俗气了点但是还是值得去去吧. 又去爬了两次香山, 都是不同的路线, 锻炼下挺好的, 在室内闷久了逗松鼠玩都是件很有乐趣的事情

冬天来人人后去了次温泉, 第一次去温泉, 泡的挺爽, 只是容易出汗且怕闷的笨狗没法持续的好好享受, 果然不是享受的命 :P

到人人后因为开会, 去密云水库附近的一个度假村呆了两天, 那段时间北京城区的空气实在太糟糕, 出去透透气非常爽. 继去年去皇后镇后再一次看到满天星空, 有种回到无忧无虑小时候的淡淡的幸福和忧伤. 但是那两天已经很冷, 风也挺大, 就没继续文艺下去, 不想在外面冻得像个二逼就回屋里好好当普通青年吧

爸妈来京, 亲情和爱情

7 月份爸妈来京玩, 不过当时在上班, 也没怎么陪他们玩, 景点本身也没什么太大意思, 老爸也喜欢自己到处晃, 就让他们自己玩去了. 爸妈每天早上六点左右出门, 玩到中午回来, 刚好避开游客高峰期和交通高峰期, 也不算太热, 我倒是觉得这种模式挺好

期间我的作息时间跟他们差太多, 一般都是爸妈出门时我妈把睡地板的我捅起来让睡床上去, 然后我还能完整睡上一觉再起来去公司上班. 晚上会比平时早点回来, 一起吃晚饭, 然后在家干会活, 一起聊天扯淡, 发现现在跟爸妈好好谈谈都是件很奢侈的事

一些陪同的项目更多都是吃吃喝喝, 略显无趣. 最后找了天跟老爸一起骑车去晃了圈北体, 堂妹在那边上学, 家里人想看看就看看, 反正也不远

跟爸妈就 MM 的事情好好谈妥了, 坚持到最后, 一开始的问题其实都不是问题. 等某喵也谈妥, 这事就成了算了, 免得夜长梦多 :P

学习

本来毕业后这个词就出现的少了, 自己还是明白得保持学习, 可惜从小到大懒惯了, 虽偶尔想想, 但也没有啥太多进步. 论文还是看的少看的不够深, 该关注的东西贴的不够紧. 还是得经常提醒和敲打下自己. 这个行业本来发展就很快, 从业者又都是即聪明又勤奋的人, 必须逼这自己持续往前跑, 才能跑到别人前面, 至少要维持不掉队吧

本打算在下半年把一些基础的东西重新回顾扎实下, 结果只好好看完了 perl 入门, 做完所有练习题后也没在实际生产中用到, 估计现在又忘的差不多了. 其他诸如数据结构, 算法, 数学等内容, 原来打算在谋划换工作时, 用不拼命工作省下了的时间过一遍, 却没料到来人人的过程会这么快, 这些事后面就被搁下了

运动和健康

考虑到自己的体重实在是有问题, 且锻炼机会越来越少, 为了逼自己锻炼, 也完成许久以来的骚包念想, 五一假的时候去入手了一辆美利达 Duke 500, 开始骑行锻炼

五月份和死猫/囧猫去了趟十三陵水库, 低强度活动, 走八高辅路到昌平城区, 再沿十三陵水库一圈, 原路返回. 期间各种欢乐, 比如赶上国际越野跑, 水库边文艺女青年和她的 A-Bike, 死猫的神奇座杆, 也还遇到有骑车的事故. 长大下坡上 45KM+ 的速度和第一次去滑雪时的感觉一样刺激

之后一直没太有空去骑长途, 有一段终于觉得自己太颓废, 自己拉了一趟香山, 只是到山脚下, 来回 30 多公里花一个多小时, 平均速度 20 多, 自己还挺满意的

秋天和死猫, 猫嫂加囧猫去了趟蟒山, 大部分路线和去十三陵一样, 连中午吃饭都是一个地方. 但是因为绕路和爬山, 对笨狗这样的新手来说强度还是有明显增加的, 途中好几次想放弃登顶, 感谢死猫一直陪我鼓励我到最上面, 最后一路放下来真的是太爽了. 可惜囧猫因为借的车刹车装反导致下山时摔了, 出事和回程少个人还是让这一次骑行还是留下不少遗憾

换工作搬家时从西二旗到柳芳来回骑了几趟, 才开始在城区骑稍远的距离, 对各种红绿灯和自行车道上的不讲究很不爽. 八高等路线上的堵车也还是心烦, 特别是不讲究的汽车把自行车道甚至人行道都霸占了时. 第一次从西二旗到柳芳路上遇到马拉松, 到底是北京此类赛事真的很多还是我运气真的很好老被我碰上?

对体重彻底没法忍, 给自己定的锻炼计划是每天 50 个俯卧撑 30 个仰卧起坐, 执行过程中还是有偏, 最近维持每天早晚一次广播体操 + 45 个俯卧撑, 肥了懒了后运动起来各种不给力啊, 随便弄弄都腰酸手疼的. 目前体重 66.6kg, 看起来不可能在 2012 来之前降到 60kg (一开始的大跃进计划) 或 65kg (后来觉得靠谱点的计划) 了. 但是还是得维持锻炼, 明年给自己定个 60kg 的体重 KPI?

骚包和折腾

清明节的时候突然脑抽进入完成式, 忽悠上阿牛一起去换手机, 入手 HTC Desire (G7/Bravo). 现在回头看, 当时不是一个太好的出手时机, 因为买之前价格坚挺了很久, 而买了后很快就跌了好多, 不过反正都是玩, 过去的事情就过去了吧. 接下来就是各种折腾, S-OFF, ROOT, 刷机, 玩软件, 一开始还有兴趣记录下, 后面就懒得记了, 现在终于回归理性, 就想要个稳定顺手的系统好好用着别出毛病就行了

换房子时重新办宽带, 薅上联通羊毛, 送了个 3G 号加一年的 66 套餐. 鉴于之前移动 159 的号还得用, 而那个 N1200 又给了熊, 干脆再买个诺基亚 C1-02 插移动号当备机, Desire 就换联通 3G 号, 在外面无聊时可以上网玩了. WCDMA 网络速度比 EDGE 确实有质的飞跃, 但是联通的信号稳定性还是不如移动, 希望联通能越来越靠谱, 良性竞争推动整个行业进步, 不要只靠国家强制制式绑定来扩展市场

被 CHH 放毒, 对乐高的科技系列无限 YY, 这不就是从小到大一直想玩却没钱买的东西么. 圣诞节前完成对自己的忽悠, 说忙一年了就当买个大玩具奖励自己吧, 果断出手 2010 科技旗舰 8043. 圣诞当天上午收到同城快递, 下午和晚上就忍不住将其装了起来, 默认的挖掘机形态. 找电池时还想自己以前买那么多 eneloop AA 充电电池终于有正经用途了, 坑爹的是这货居然是 6*AA (机体) + 6*AAA (遥控器), 最后拆各种电视/空调遥控器终于再凑够六节 AAA, 玩的甚爽, 准备元旦或什么时候拆了挖掘机形态换推土机形态

换工作后去办了户口和档案迁移, 真是各种坑. 现在看事情应该都办完了, 回头单写一帖说这个办理过程, 也给其他人一个教程介绍

因为翻墙需要, 在 flyssh.net 上买了一年的 ssh, 后面推荐别人买时发现他家还提供主机服务了, 最便宜的一年才 20 块钱, 试试看的心态就买了个玩. 把 yewen.us 指向这, 也就有了最新的这个 笨狗又一窝, 最近一两个月花了些时间把以前散落各处的日志合并整理到这里, 现在只剩以前 Q-zone 的一百多篇没有分类和打 TAG, 其他的都搬好了, 真是体力活. BBS 上写过的一些东西, 虽然值得纪念, 但找起来都难, 还是算了

遍地创业机会?

从百度离职后, 看了很多不一样的东西, 也被很多朋友介绍说去创业吧, 所以有此一篇

遍地黄金的创业机会?

接到过一些创业邀请, 主要在 手机应用, 增值服务 两个方向, 听起来就像是说 “遍地是黄金, 谁不捡就是傻子”

移动互联网现在很热, 也确实有很多一夜暴富的案例, 但是是不是真的就遍地黄金想拿就有? 我还是觉得未必, 一是笨狗胆小, 二还是觉得这不符合我理解商业规律. 我个人觉得 90% 的创业公司 (或者说创业项目比较好) 会死掉这个说法绝对不是夸大其词, 甚至在我看来, 只会更高, 特别是现在很多完全没有仔细思考就一猛子扎进去乱搞的人越来越多, 跟当年股市泡沫好像就是一样的嘛. 移动互联网上的很多创业都是 “觉得一个东西好玩” 就去做, 很多都只是创业者自己的小众需求而已, 没法扩大规模, 没法变现, 最后, 只能死掉

商业模式是才是最后赚钱的核心

前一段在回顾浪潮之巅时, 自己掰出来这么一句话:

创业的最高层次是创造新的生活方式, 并衍生新的商业模式

这句话更多的是想说 Twitter 和 Facebook, 这两个公司都是创造了一种新的生活模式, 让个人的信息发布和联络渠道发生了颠覆性改变, 其革命程度不亚于当年 Google 等搜索引擎把大家获取资料的方式从目录检索变成关键词检索. 但是抛开 “伟大” 而言, 大家都是要吃饭的, 再看看这两家的盈利状况呢? Twitter 现在似乎一直没有一个靠谱的盈利模式, 从外界能获取到的信息看来, 能维持运作就不错了, 而且最近 Twitter 的更新越来越慢, 都让人怀疑他们还在没在好好做产品. Facebook 虽然没上市, 没公布其财务状况, 但是外界的信息显示他家今年的利润应该不下 10 亿美元, 而且吸金能力越来越强. 所以, 这两家我看好 faceboook 的前途 (虽然我不喜欢 facebook 这家企业, 但是喜好和看好是两码事), 觉得 twitter 会在不久的将来挂掉.

两者最大的区别就在于是否找到了一个可以健康发展的商业模式. Facebook 利用他强大的用户信息网络, 能将定向投放广告做的越来越准, 而且他的用户黏性保证了这个广告市场只会越来越大, 广告主们竞争越来越激烈, 整个体系是一个健康前进的生态系统. 反观 Twitter, 因为更多的是只言片语, 且有大量的 API/客户端 分流, 用户黏性小 (更多指的是在其网页上的停留时间), 没有定向广告的能力, 又没有从用户那收钱的增值服务, 想不出来后续能靠什么撑下去, 概念最终总还是要落地, 童话的最后公主和王子在一起后, 也还是要过柴米油盐的生活, 不切实际的泡沫总会破灭的.

如果说前面说的更多是对未来的展望和分析, 有个人喜好因素在里面, 那我们回顾下历史. 互联网上这几年 Google 和 Yahoo 应该算是反差最大的两家了吧, G 的绝大部分收入还是来自 AdWords 和 AdSense, 前者依托他强大的搜索技术和用户量, 后者依托其海量数据处理能力和庞大的广告主资源, 虽然 G 一直想多元化经营, 但是很遗憾, 其他部门的营收真的只能算九牛一毛. 而 Y, 一直守着自己的目录式搜索, 跟进关键词搜索的模式还是慢了点, 而且技术也糙了点, 等发现广告市场的风向从 Banner 广告转向精准定位时再去做 panama, 不仅时机上落后于人, 技术上也一直跟不上, 发了那么多 paper 也无济于事. 市场只看结果, Google 两倍于 Yahoo 的 CPM, 再加上几倍的市场份额, 就注定了一个会进入良性循环而另一个在恶性循环中苦苦挣扎, 好像 Yahoo 都快要被收购了?

再举个例子, Apple 和 Nokia. Apple 固然有其工业设计等因素推动其前进, 但是 App Store 确实是个伟大的战略, Apple 通过 iPhone 的强大, 时尚等特性扩大用户群, 然后通过 App Store 来吸引开发者, 把付钱和赚钱的渠道打通, 然后两边都能进入良性循环, 用户能有越来越多的好应用可以使用, 开发者也越来越容易从自己的好作品中获利. 而 Nokia, 现在好像只剩下调侃他 结实 和 续航 的段子了, 功能和设计上的不思进取导致了用户群流失, 对开发者不友好, 开发者很难赚钱导致开发者流失, 最后也就只剩下 Nokia 自己在推官方应用, 以及一些大公司为了安抚用户推出点 Symbian 的客户端, 用户和开发者两边都恶性循环, 最后的结果, 微软要收购诺基亚的谣言好像又越来越盛了?

增值服务都在闷声发大财

前面那个部分基本上都是在吐槽, 也没提出什么建设性意见, 毕竟生活方式的革命不是谁都能想出来的, 最近几年全球在互联网和移动互联网上的大跃进也基本上掏空了大家的需求. 如果不能 revolution, 那回头考虑下 evolution, 很多传统行业还是在低调的赚钱, 赚大钱, 靠的就是 evolution.

因为工作关系的原因, 过去几年关注互联网广告比较多, 这是个很奇怪的市场, 不管是国外的 Google, Yahoo, Bing 等等, 还是国内的 百度, 淘宝 等终端服务商, 都在拼命发展自己的技术能力, 把系统弄的越来越牛逼, 也越来越复杂, 而需要使用此服务的广告商, 根据个人的了解, 不管国内还国外, 都是小白, 而且一个比一个白. 看起来好像是先进生产力和生成方式跟落后劳动者的冲突了, 解决这个问题, 要么是广告主自己学习进化, 去适应更精细的游戏规则, 但是这个途径太麻烦, 并不是每个人都需要在每个领域都成为专家, 特别是很多广告主是中小企业, 压根没有人力来做这个事情, 大企业很多也没有太多人力来做这事, 那要么就是引入中间人, 让专门的人来做专门的事. 说到这, 想起来前段时间京东老总刘强东在微博上说要自己建干线物流, 其实也是类似问题, 要么由中间人 (干线物流公司) 来完成这部分自己不擅长, 也不必要去擅长的工作, 要么就自己花很大成本去做这事了, 这是一个反例.

回到互联网广告的中间人, 一般会管他们叫 广告代理公司 或 SEM (Search Engine Marketing), 这个市场在国外貌似稍微成熟一点, 在国内大都是很糙的起步阶段. 这里面有非常多的事情可以做, 不同的网络媒体, 不同的投放优化方式, 拿人钱财替人消灾, 据说这个行业的毛利润至少有 10%, 佣金是一部分, 优化后的利润空间自己也可以分一部分, 可惜现在这个圈子缺人缺技术, 好多人都是看着钱在面前, 却捞不到, 腾不出手捞, 没空捞.

在互联网广告之外, 帮别人赚钱也是一门很大的生意, 淘宝自己就是干这事的最大中间商, 什么聚划算啦, 直通车啦, 都是为了更好的让卖家赚钱, 同时自己收佣金或压缩成本获利. 在淘宝之外, 目前应该也有好大一批帮淘宝卖家赚钱的创业企业在行动了, 我猜赚钱也是大大的, 低调发财真好. 因为有朋友在这个圈里, 为了不直接导致市场白热化, 这事就不说太白太细了. 继续感慨 “小钱钱, 真心甜.”

游戏行业的暴利

早几周本科室友 6k 来北京玩, 因为他自己是个狂热的游戏玩家, 同时也在游戏行业做了好几年, 于是就扯这行的暴利. 现在在互联网上现在被骚扰的最多的估计就是游戏广告, 而且游戏广告都很贵, 从这点上来看也就知道游戏有多赚钱, 不然他们不会一直烧下去的.

国内的网游应该已经没有靠点卡赚钱的了, 魔兽世界这种极品不是阿猫阿狗都做的出来且能运营好的, 绝大部分都是靠增值服务, 提供钱换时间的服务, 比如更好的装备, 更快的升级等, 更赤果果的是卖道具, 除了好看啥用都没有的道具, 还贼贵. 考虑到现在做一个真正好玩的游戏确实太费时间太难, 点卡赚钱不靠谱, 破坏游戏平衡性的增值服务又不能搞太多, 那么最后现在大部分游戏的运营模式都进入了这样一个外人看不懂的怪圈:

  • 通过免费, 甚至送钱的方式, 吸引大量玩家并努力保持黏性 (赚点卡的境界)
  • 发展高端付费玩家, 让大量玩家陪玩, 使他们获得尽可能大的满足感 (破坏游戏平衡性的增值服务境界)
  • 引起付费玩家的妒忌, 让他们互相砸钱买无用道具来攀比 (让玩家烧钱给自己的境界)

老实说我自己觉得这种方式太下作, 但是人傻钱多这种事情又不是我能决定的, 官二代富二代烧的钱再怎么来路不正我也没有足够能力去明显改变这个世界, 这里只是说下暴利情况. 千万不要看不起烧钱的玩家, 人家都是可以几秒钟花几万人民币的, 所以, 养好你的免费玩家, 甚至雇点职业玩家陪好人民币玩家, 然后就让他们互相在你的游戏里烧钱就行了. 如果没有那么强烈的正义感, 也不像某些游戏制作人一样有真正的梦想, 有点技术又想快点捞钱, 这个路子确实不错. 但是我还是会持续鄙视做这种游戏, 运营这种游戏, 和在游戏里烧钱的人.

这一节主要是想说, 你是否赞同并支持自己做的事和赚钱是不冲突的两回事, 只要你放的下良心和矜持, 钱也还是比较容易来的. 这一点, 比如 Jack M, 嗯 这事不能说太细.

关于毕业去哪里

因为自己最近换了个地方, 看了看最近呆过的这两家, 更像是同一家的不同阶段. 百度已经相对成熟化, 更多的是靠整体技术和制度在驱动, 而人人相对有更多的个人英雄主义和随意性.

对应届生来说, 如果不是自己能力比较强, 或自己有很好的想法, 还是建议去类似百度这样, 还在上升期的技术性大企业, 学东西相对有保障, 周围有热心的大牛的概率也要高很多, 钱可能会少点, 短期收益不会那么明显, 但是长期来看是在打更扎实的基础. 相对的, 爆发期的小企业会有很多机会, 发挥的自由度会大很多, 如果有不错的底子, 只要是不那么坑爹的团队, 总能干出点很赞的事情. 缺点基本上就是两者的优点互换一下, 大企业的整体框架会相对稳定, 制度比较完善, 每个人更多的会扮演螺丝钉的角色, 而且看事情的面会稍微窄一点, 做的比较好也是某个位置上比较优秀的螺丝钉. 而小一点的地方如果遇上好的老大和团队, 确实能更快更好的成长, 但是这种机会相对可遇不可求, 所以除非确定, 按笨狗胆小心理, 是不会去赌的.

招聘算法工程师/C++后台研发工程师

人人网招聘策略工程师, C++ 后台研发工程师. 职位描述如下

算法工程师

工作内容

  • 对人人网相关产品进行数据分析, 提升产品用户体验
  • 处理海量数据, 快速开发新产品原型, 验证策略效果

职位要求

  • 有较强的数据处理和分析能力, 较强的逻辑思维能力, 对技术和产品都有很好的敏感度
  • 利用现有数据, 提升广告投放相关性, 设计新产品的策略并持续提升
  • 喜欢做有挑战的新事情, 并解决现有问题
  • 熟悉 C/C++ 语言编程, 熟悉 Linux/Shell/Python 等应用场景, 对算法和数据结构有较好理解
  • 良好的沟通能力和团队协作精神
  • 有 hadoop 或其他 map/reduce 系统使用经验者优先
  • 有数据挖掘, 机器学习, 自然语言处理经验者优先

C++后台研发工程师

工作内容

  • 维护人人网的系统开发, 提升系统效率, 稳定性和处理能力, 以及新产品的开发

职位要求

  • 优秀的分析问题和解决问题能力, 喜欢解决有挑战性的技术问题
  • 较强的 Linux 上 C/C++ 开发能力, 熟悉 Shell 编程
  • 熟悉网络编程, 多线程编程技术
  • 对数据结构和算法有较好理解
  • 良好的沟通能力和团队合作精神
  • 有相关系统开发和设计经验者优先

个人补充说明

人人是中国最大的实名社交网络, 有更真实更密集的用户数据, 我们希望通过数据挖掘, 机器学习等方法来改善我们的产品, 为万千网民提供更优质的服务.

这两个职位同时对校招和社招开放, 对于能尽快入职的社招同学或能过来实习的校招同学尤其欢迎. 由于人手不够, 会优先考虑将合适这两个职位的同学转到广告相关领域. 算法工程师后续会有较大机会参与到应用研究和改善中去.

有对职位感兴趣的同学, 请将简历直接发给我 (wen.ye@renren-inc.comi@yewen.us), 邮件标题注明 “应聘_职位_姓名

百度, 再见

正如昨天的一系列状态, 照片等描述的, 我从百度离职了. 离职这个消息似乎震撼了不少朋友, 关注最多的问题是 “为什么要走” 和 “去哪里”.

引用下昨天的告别邮件, 应该可以解释一些东西 (个人信息部分马赛克了)

Hi all,

因为个人原因, 叶文将离开百度, 今天是我在百度工作的最后一天

还记得 07 年夏天第一次来百度实习, 当时那个空有一腔热血却什么都不懂的毛头小伙, 来到业界跟着大家学习如何的用技术改变世界, 去让生活更美好. 当时发现, 原来不仅仅是学校可以这么轻松平等和自由, 在百度的沟通交流可以更简单, 那么多简单加在一起就变成一份又一份的可依赖. 百度,是梦开始的地方
回去读研并在外晃荡了一大圈后, 还是百度接纳我, 让我能跟这么牛的你们一起做如此有创造力和挑战性的工作. 开启凤巢, 用数据去驱动机器学习, 让系统自我学习自我进化, 去提升网民体验, 提升广告主效率, 提升我们的变现能力, 去改变世界, 改善生活. 百度, 是梦一步一步实现的地方

非常抱歉接下来没法和大家一起前行, 我想要自私的去实现一些自己的小梦想, 对那些未竟的共同梦想, 只能说一句对不起

非常怀念我们在一起奋斗的日日夜夜, 一起干活, 一起思考, 一起追问题, 还有一起吐槽和打闹, 跟每个人共事都是那么的开心, 顺畅和自在, 能认识你们, 真好
非常感谢每个人对我的指导和帮助, 容忍我的错误, 带我高速成长. 非常感谢大家一直以来的关心和照顾

接下来我还会在北京, 手机号 159****5701 预计用到下一个春节, 其他联系方式:
手机: 186****9231
邮件/Gtalk: whu**@gmail.com
QQ/Hi: i@y**.us
MSN: whu**@msn.com

再次谢谢大家, 请保持联系, 祝大家生活工作一切顺利
再会!

叶文
2011-11-08

具体的解释:

  1. 我没有去创业, 而是到了人人网, 希望能在这边做一些和推荐相关的工作
  2. 离职的原因可以有很多, 但是对应起来更多的是留下的理由. 扯那些没用的理由太虚伪, 最直白简单且无可辩驳的理由是: 这边离 MM 更近一点, 看看最近我显摆晚上能回去吃饭, 中午偶尔也回去弄吃的就能明白这是一种怎样的幸福
  3. 竞业? 首先做的东西已经不一样了, 而且是没有什么竞争关系的业务, 哪怕技术基础是相通的, 还是没有关系的, 否则百度出去的任何一个人都不要想继续找工作了, 因为任何一个方向都是百度现在或未来的发展方向. 然后我还是小兵一个, 没签, 也犯不着被竞业

[无责任转贴] 原来南大寂寞门是这么个鸟事…

http://kisshi.com/2009/09/13/jimonanjig/

2009年9月10日晚南大寂寞门故事的真正起因发生在1栋男生宿舍。当晚10点45分,某室一男生A与室友单条星际被同一战术连胜N把,精神崩溃,大声叫喊着裸奔而出,声称意欲跳楼自尽。周边宿舍见有人裸奔,纷纷冲出宿舍围观。A同学试图爬上顶楼,被室友拉住。室友劝其不可轻生,人生还有许多未竟之事。A同学仿佛突然想起某事,声称还未向自己爱慕已久的辅导员表白,随后冲出宿舍楼外。众人反应不及,未能阻止。在1栋与3栋宿舍楼外,巧遇学校广播试音,不料试音内容竟是某军训教官向A同学所倾慕的辅导员的表白。A同学悲愤交加,在楼下放声怒吼。此时3栋一男生正在走廊上用手机向某女教官表白,不料看到一男子对着3栋怒骂,误以为撞到情敌,随后立刻回骂。不明就里的A同学及闻声而来的A同学室友,立刻积极反击,随后1栋和3栋男生倾巢而出,霎那间,两栋楼间,起哄声、大吼声、对骂声,不绝于耳。1栋与3栋中央地带迅速聚集大量人群,众人不明就里,疯狂围观。恰在此时,某寝室几位新生听到人声嘈杂,误以为是军训拉练,紧急集合。随后迅速冲出宿舍楼。楼下众人忽见几人狂奔而出,衣衫不整,冲入人群。随即有人大喊:“甲流隔离者翻墙越狱啦!”全校迅速陷入混乱,有同学悲观地指出,甲型H1N1大面积扩散已经无法阻止,即将封校。该言论迅速传播,仙林校区全面混乱。部分寂寞党人声称如果封校,就纵火反抗,火灾的谣言又开始流传,骚动升级。大量春哥教徒走上街头,宣传教义,告诫大家不必恐慌,信春哥者水火不进,甲流不侵。此后,局势慢慢的稳定。大量同学们在春哥信仰的指导下回到宿舍,校区慢慢平静。