碎碎念

愤一句, 千万不要相信任何中文媒体

新华社和 CCAV 等对国内新闻的报道态度大家就能看见了吧, 不用我多说, 在国际报道上, 你觉得他们会从良么?

中文网络媒体, 大多都是转来转去, 从来不确定消息源, 这也跟编辑们都要吃饭有关, 别人有的你没有, 老板会说你们怎么干活的, 在时效性的要求下, 真实性算个球, 有流量才是王道

中文微博, 那更是不知道哪来的消息了, 在国内短网址服务这么发达的时候, 还是懒得贴一个原文出处, 谁知道真的假的, 而且看到就转发, 丝毫不过脑

当然, 不是说英文/日文媒体在方面就要好很多, 其中也很多骗子, 比如有一个 XXX 邮报来着, 让国内很多媒体出过糗了, 再比如大家都懂的西太平洋大学. 主要还是看自己的分辨力, 而不是人云亦云

有关日本近海地震后的假消息满天飞有感, 顺带骂一下前几天说 ORACLE 要收购 AMD 的

PUZZLES 群聚段子补遗

0x00 某公司的报销制度非常苛刻, 只能一次报 20, 大发票不能拆开报几次, 所以他家的人都找小额发票
0x01 上面是铺垫. 这次给某人带了一把最大不超过 50 的手撕发票去
0x02 在 IW 的大会议室的某个角落, 给发票时不小心被别人看到了, 然后有人喊了一声 “发票, 发票”
0x03 于是我只好跟着喊了一句 “光盘, 光盘”
0x04 某熊在摆弄他的 ip4, 很 (此处感情请自行脑补) 的说, “人说用 iPhone4 的人傻钱多, 我终于也迈入钱多这个行列了”
0x05 某狗今天算了下, 手头上除了电脑就没有别的数码产品了, 无语啊
0x06 手机是黑白屏的, 数码相机没了, 各种 pad 更是毛都没, 我好像只满足 “人傻” 这个 feature

碎碎念 20110301 (20110309 写完)

最近有很多事情值得记录下, 想到哪写到哪吧

0x00 工程师的理想

年会上 “盒子里的梦想” 是一部绝佳好片, 同时也让很多人开始回忆或思考自己的理想/梦想是什么. 我一直固执的认为, 理想是在现有条件下, 在可预见的未来, 通过自己努力可以达到的愿望, 而梦想, 把理想定义的三个修饰词都换成未来条件, 不确定的将来, 必须要天上掉馅饼才能达到的愿望. 拿自己现在的状态来说, 理想是手上这几个项目能顺利推进并发布, 在此之间提升自己的能力和思维, 并获得公司升职和涨薪作为认可, 梦想, 梦想就是我现在隔三差五还是会买个彩票, 嗯, 你懂的.

最近看到挺多牛人从 Google 跳去 Facebook 的报道, 于是在 Twitter/Buzz 上评论了下, 大意是公司大了后很多事情就没那么灵活, 很多人的想法得不到满足, 觉得自己无法展现价值, 于是去能更自由发挥的地方. 在这点上认为钱真的是小事, 那些大佬们应该也早不缺钱了吧, 而且 G 家应该也还是会花挺大成本来挽留这些人的, 除非真的就是 G 的高管和 HR 们都脑子进水了, 不然就是所谓的大佬是 “水货”, 走了也不可惜. 换到自己身边来, 倒是看到挺多人去了创新工场, 虽然我一直不看好李开复, 也看不懂创新工场的盈利模式, 但是不阻碍挺多人放弃现有的稳定工作或自有创业跑去那边拿更少的钱更开心的每周六天的工作, 至少, 从我认识并且还能称得上熟悉的朋友表现出来的感觉就是, 他们真的在很 high 的做自己的事情.

身边的一个朋友最近出了点状况, 在换工作过程中就在纠结到底是去个相对稳定靠谱的国企, 还是去创新工场这样职位和工作内容都太对自己胃口的地方, 不过他的身体相对偏弱一点, 所以每周六天工作这个反倒是一个比较大的影响因素了. 上周末跟着某技术群去创新工场听几个讲座, 跟一大堆圈内朋友一起扯淡, 发现大家其实都是一样愤青, 只是愤青程度不同罢了. 考虑上个人情感因素, 我还是觉得寨厂的同学们是相对更愤青的, 究其本质, 还是寨厂的 KPI 文化导致了整个公司的一些奇妙状态, 比如已有的系统只要转的动, 那再烂也不会有人去动, 因为弄好了没成绩, 是你本来该做的, 而弄挂了是坏事, 再比如一些质量的问题, 在大家都在疯狂跑步前进的时候, 你在一步一步扎实前进, 等你扎实的成绩出来时, 别人可能早就甩开你了, 又回到第一个比如内的困境.

此部分未完待续, 属于工作是为了什么的继续

0x01 PUZZLES 群聚

0x0100 IT 民工们纷纷表示周末下午一点在中关村碰头是不是太早了点
0x0101 到达现场后立马出现了三台 MBA, ip4 这种大路货就不再有人围观和询问了
0x0102 zouyu 同学讲的时候, 问了下大家现在在用的手机系统, 笨狗坚持自己曾经用过的 s60v3 也是智能机, 现在的 n1200 不算
0x0103 是不是真的该去换个好点的手机? 好歹也要跟上时代吧? 自己没事折腾下应该也还好

// 因为各种蛋疼原因, 上面写于 3/1, 下面写于 3/8

0x0104 开场前大家在 IW 研究那几台 MSI 的平板, 全在扫雷, 触摸屏不能右键太疼了
0x0105 忘记是谁说的了, “高手扫雷都是不用右键的”
0x0106 大多数人表示, “扯淡, 扫雷不用右键那还扫个腿”
0x0107 一堆人继续很有兴趣的研究了下那个平板电脑怎么判断触屏操作的, 某人说是红外摄像头 (今天 PUZZLES 群还就这个问题讨论了很久)
0x0108 讲座完了后和 lxh 在平板上来了一局国际象棋, 俩新手 (我是纯入门, lxh 应该还是入门过的) 在上面下的让一群不会的人都看的蛋疼
0x0109 互相失误让了几个子后, 一致表示场面上子少一点比较好, 这样入门级选手才判断的过来, 有助于发挥真实水平
0x010a 最后和局… 至于为什么和局, 这个, 嗯, 主要是我太弱了, lxh 再让我他就死了, 不让我的话我就死了, 于是握手言和

// 继续因为各种蛋疼原因, 上面写于 3/8, 下面写于 3/9

0x010b zouyu 同学讲的 Web 应用转手机应用, 现在在 PC 领域应该也挺多的, 是个比较赞的快速推进方法, 但是要做好估计还是有难度
0x010c dikang 讲 ZooKeeper, 终于明白了为什么很久以前 czogogo 说 cosmos 的主控是投票得出的, 可以进行比较好的热备切换, 应该是一个原理
0x010d 不知道某家的 Hadoop 有没有引入这个功能, 在某群问了下没人理我, 问 boluor 也不是非常清楚的样子
0x010e 不过某家的集群问题大头应该不在这边, 今天还要去讨论下改进方向和方法. (更多涉密内容, 请自行脑补)
0x010f jin 讲 news cluster, 因为以前在某家做过 news search, 有不少东西是可以比较好明白问题描述的, 这个比较爽
0x0110 不过当年太弱也太傻, 没怎么看核心的东西, 所以也不好比较优劣度
0x0111 倒是看起来跟以前做的 image content search 更像一点, 做聚类然后方便 search
0x0112 大概了解了 M 家说的实时库和 T 家小库/大库等结合方式, 不知道在寨厂的太医院能不能做, 把反馈时间从天级别变成小时甚至分钟级别
0x0113 不过这个可能往另一个方向去想会更好, 比如个性化? Realtime xxxx? (更多涉密内容, 请自行脑补)
0x0114 题外话, M 家的人 PPT 做的都很好, 至少看着很舒服, 比如 zouyu 君的简洁流, 和 jin 的图文 paper 流
0x0115 这里有点打击 kangkang 了… 其实比国内大部分的 PPT 都要好了, 只是某狗在 UE 方面向来比较挑剔, 然后跟那俩对比了下
0x0116 聚餐还是很开心的, 聊了很多乱七八糟的东西
0x0117 发现 IT 民工都是一样愤青的, 只是愤青程度不一样而已
0x0118 不知道是因为在座的寨厂工友都偏激还是咋滴, 反正感觉寨厂工友是最愤青的 (熊你就不要装了, 你比我愤多了)
0x0119 KPI 文化害死人, 让大家都在变成螺丝钉而不是有理想的攻城师 (此处不是笔误, 故意的)
0x011a 理想这个东西, 很纠结, 但是必须要保持. 位卑言轻, 有理想也没用, 先在 KPI 文化下爬上去; 说话管用后, 推些理想的东西还是不错的
0x011b 所以说起点很重要, 环境也很重要, 最重要的, 是自己一直还能坚持自己的理想

0x02 2011/03/09 杂念

0x0201 今天早上更新 Win7 SP1, 本来是打算全新安装的, 不过看 Windows Update 都推送了, 就装玩玩吧
0x0202 不过 X201i 居然蓝屏两次才搞定, 真疼, 也还好他蓝屏我才有时间写这个
0x0203 最近几天在干跟 KPI 无关的事情, 但是确实是很理想的东西, 我很幸福
0x0204 SPILT: spill 的过去式和过去分词, 使溢出, 使流出, 泄密; 使摔下使跌倒; 他喵滴这说的不就是坑么
0x0205 自己对自己今年的目标是, 第一想尽办法干掉这个坑爹的玩意儿, 第二才是自己的项目推动
0x0206 都很美好, 都很有理想, 希望明年这时候, 我还能维持这么有理想
0x0207 最近每天 8:00 前来, 视情况 18:00-23:00 走, 做事, 积累, 无愧于心

愤一句: 去你大妈的 “要穿防辐射衣, 要放仙人掌, 好防电脑辐射呢~~~”

原文请见: http://www.guokr.com/article/6606/

笨狗的意见: 去你大妈的防辐射, 看电视比电脑辐射大多了, 太阳还是最大的辐射源呢, 各种辐射都搞不清楚就乱恐慌. 难怪现在的女生都狂涂防晒霜还很少出门, 太阳天一定要打伞, 你们就不怕缺钙缺维生素 D 么? 什么? 你说你有喝盖中盖和吃金维他?

工作是为了什么? (2)

继续填坑, 今天开始数自己曾经有过的兴趣. 如果从大学开始算的话, 兴趣和持续时间大概如下分布:

2004~2007, ACM/ICPC. 这个很难说是一个怎样的兴趣导向, 最早确实还是有一定的功利性在里面, 但是到后面, 自己确实还是很喜欢这个游戏, 喜欢他的公平, 喜欢能通过这个接触到大量牛逼且好玩的人, 自己玩的很不怎么样就是了. 在这个兴趣持续的过程中, 参加了两年的 ACM/ICPC 区域赛和一些武汉地区的邀请赛, 但是很奇怪, 一直没去过华工的校赛, 连去观摩都没有, 同样, 也没去过国防科大, 这个也很遗憾. 作为一些打杂的工作, 在中间还维护了一段时间 OJ, 也办了一次校赛, 出了一次题, 也还是挺有意思的.

2004~2009, 灌水, 在 BBS 上灌水, 用 telnet 模式. 最早好像也只是因为有网上, 然后当时没有别的事情可以做, 我又不喜欢打游戏, 于是灌水, 一直到出去实习网络状况不好, 且以前一起灌水玩的人大多都不在了, 于是作罢. 在这个兴趣持续的过程中, 参与到山水的维护和管理中去过, 当过版主当过站务当过程站当过站长当过美工, 封过人, 被封过, 到后面都不算是个事了, 帮过人, 维护过精华区, 做过看板, 做过进站, 就差没去做仲裁了, 但是, 毕竟也还是一个小站, 就那么点人那么点事, 到后面也就淡了忘了完了.

2005~XX~2011, DIY, 或者更严格一点, 应该叫看人 DIY. 这是我一个很奇怪的倾向, 会喜欢很多事情, 但是都是喜欢看, 而不是自己真的投入进去. 这中间比较关注的时间段就是大一大二自己装电脑和帮同学装电脑的时候, 到后来就没研究了, 只是偶尔看到还是会继续. 07 年自己买笔记本后, 倒是对这个本还折腾过一段时间, 后来也懒了不想折腾了. 到工作后看到 SC2 出来, 先是大脑一热买了个显示器, 然后再买了个主机, 又关注了一小段, 然后发现要继续烧下去还要很多时间精力加金钱, 我好像没一条是比较充裕的, 于是还是放弃吧.

2004~xxxx, 游戏, 跟上条一样, 是看游戏, 不是自己玩 -.- 这个兴趣更奇怪, 但是确实就喜欢看人玩那些大游戏, 然后自己去看到底是怎么回事, 就当看电影一样, 也许是我懒得费脑子懒得动手吧, 也许是我还是对什么事情都太看重, 玩游戏死了后会很不爽… 但是自己水平又太菜, 做不到只虐人而很少被人虐

2006~xxxx, Web UI/美工. 之所以会对这个有兴趣, 还是一种追求有条理, 完美世界的本能, 自己还是希望什么东西都是条理清楚的美好的东西, 不能接受粗制滥造的界面, 包括但不限于网页界面/软件界面/设备界面等, 所以既然别人给不了, 那就自己去做好了. 在这期间, 就是完成 oak 那个 UI, 以及一些自己娱乐用的东西, 还有 WHUACM2006/07 的竞赛网站 UI, 以及一些山水的美工/进站图. 这个兴趣很费时, 而且很要灵感, 所以也还是断断续续的在跟进, 目前自己手上还在有一些自己折腾的小玩意, 包括前段时间做的那个很简单的 Rank Logo, 包括现在 yewen.us 的界面更新.

2005~2008, 断断续续折腾手机. 05 那时候是买自己第一个手机, Nokia 3120, 居然还自己弄了根线去导数据啥的, 但是那个机器实在没啥好折腾的, 作罢. 07 秋天从百度实习回去, 手里有点钱就骚包的买了个 Nokia 6120c, 当年还是很不错的一款平民机, 后来也是经典街机, s60v3 的系统, 曾经有那么一段时间老是折腾证书, 签名, 装软件, 换字体, 破主题啥的, 但是这个兴趣很快就没了… 主要是发现实在没啥好折腾的, 弄好后就一直不想动了, 甚至于到香港后, 因为弄的手机号只有打电话便宜, 干脆还换了个 Nokia 1200… 这下彻底清静了

2004~xxxx, 跟新软件. 这条属于不折腾不舒服斯基的, 很多时候就是觉得好玩, 去折腾很多新软件玩, 以前玩桌面扩展, 一些小工具, 后来还跟过一些腾讯系的很多软件内测, 现在倒是有折腾下新系统啥的, 不过都不那么狂热了.

2006~xxxx, SketchUp 建模. 这个应该属于和美工什么算一起的, 最早是看 Google 收购的这个软件, 然后看小强用, 然后自己觉得挺好玩的, 也去弄着玩, 不过自己弄的都很土, 但是也还算能用, 在香港时曾经无聊把住过的房子都建了个简单的模型, 发给 lishan 时这家伙又在忿忿不平说怎么你这家伙什么都会, 我会的你好像都略懂那么一点.

2007~xxxx, 魔方. 这个兴趣的开始是在谷歌上海, 当时公司里有一个贴纸是 Google 各产品 Logo 的 Rubik 原厂魔方, 在去甪直玩的大巴上跟 DuJia’en 坐一起看他玩, 他告诉了下 CFOP 的基本概念, 在大巴上学会了他自创的第二层还原法, 回来后自己对着教程研究了一个星期的最简单版第三层, 能做到独立还原, 用最土方法做到 sub 2min. 这中间和 zouyu 一起去参加了一个上海魔方爱好者的聚会, 看了 n 多好玩的魔方 (照片我的 picasaweb 和 QQ 空间里都有), 看那些能 sub 20 的人, 真是太崇拜了. 那时候国内的好魔方只有国甲和国丙, 国乙那时候好像已经停产了, 而可选的也就是黑白两色, 自己买了一个, 记了一点 OLL 和 PLL 练到了 1min 左右. 08 年实习完了回学校后忽悠了一大群小朋友跟我一起玩, 华师那个卖魔方的应该好好感谢下我, 要没我忽悠武测里应该没那么多玩魔方的, 这时候最好成绩到过 sub 40, 但是那是某次吃饭的时候临时转出来的, 也没能稳定在那个时间, 自己也没特别去练习, 一直也就是 sub 1min. 到香港时还忽悠小崔姐姐买了个玩, 那时候发现国甲都已经出到三, 都不知道到底是啥状况了. 09 年夏天到微软实习时发现旁边 block 有一个 FTE 那有一堆异形和高阶魔方, 又无聊的拉着 momodi 陪我去三元桥买了一次魔方, 多了镜面/空心/四阶/粽子几个品种, 为了纪念买了个 Rubik 原厂 (这玩意儿很不好玩, 除了收藏强烈不建议买), 等到把镜面完全玩熟, 四阶和空心只剩下最后俩棱块不会调要看教程, 粽子总能试成功的阶段后, 兴趣又慢慢的降下去了, 没去再买高阶和异形玩, 也没有自己去 DIY 异形. 这个爱好相对其他的爱好来说是相对小众而且持久了, 曾经一段时间也成了个人标签, 能在陌生环境下用这个很快跟别人打开僵局开始沟通, 曾经想过出一堆和魔方有关的题, 但是到后来还是不了了之, 这个拖拖拉拉的性格啊.

2008~xxxx, 铁路. 首先要辟谣的是铁路不仅仅包括春运买票这么蛋疼的事情, 虽然我最早喜欢上铁路的大部分原因还是要买票去关注的. 正如 sandy 在上一帖后面回的, 男生在小时候大多都对大型精密机械有一种狂热的爱好, 男孩子大多都会喜欢火车喜欢轮船喜欢飞机, 大概就是这样的表现吧, 只是这样的爱好随着时间推移, 很多时候也就慢慢淡忘了, 而如果有心, 则会找一个类似的兴趣寄托下去. 最早看铁路相关的东西是在海子 (hasea.com, 已被关), 那时候看很多铁路规划, 看机车, 看车辆, 看两万吨的大秦, 看 CRH 各种动车一直到 1B, 2B, 2C, 2E, 1E 出来, 看芍药看小三看四哥看扫把看香蕉金刚美女看烧酒看青蛙, 看西瓜看武警看狮子看猪, YY 自己什么时候能在绿皮车上慢慢晃过那些如画的旅途, 刚好武汉也是个枢纽站, 有时候能出行时, 自然就会关注下, 到香港后还有不一样的车看, 更是好玩, 而模型这种东西, 应该也是很多人从小一直口水下来的, 可惜也只是口水而已, 一节机车上千, 一节车厢上百, 加上轨道, 控制电路, 场景沙盘等, 实在不是我等四处漂泊的穷鬼能享受的. 海子关了后一直看的是铁路在线, 但是就没那么狂热的追别人的帖看, 只是有空时, 对那些自己还有兴趣关注的东西进行跟进, 然后在力所能及的范围内扩大自己的乘车体验, 比如去年春运坐 L415 走京九-横麻-京广-沪昆-洛湛这样飘逸的线路, 比如特意去找绿皮硬卧晃荡出去玩. 至于说车票预售期, 春运该怎么买票这些, 实在都是一些零零碎碎的意外收获而已.

200x~xxxx, 关注业界新闻. 这个, 如果也能算兴趣的话, 那就算吧, 很多时候就只是想知道这个世界都是怎样的, 虽然很多事情与己无关, 但是, 知道了也没啥坏处吧.

看看这些爱好, 其实大多跟工作都是扯不上关系的, 能大概对应上的只有 ACM/ICPC – OJ, ACM/ICPC – WebUI, 灌水 – 美工, 有其他几个业界相关的兴趣, 也就只是看起来好像相关而已. 这么一算, 问题就来了, 到底是去做自己兴趣所在的工作, 还是用工作来维持生活本能, 然后把更多的业余时间投入到自己的兴趣中去?

把兴趣当工作其实是一挺不靠谱的事情, 如果一件事情, 从吃饱撑的才会去打理的兴趣爱好变成有责任有要求的工作时, 大多估计会变成负担而不是兴趣加强. 比如以前很希望玩 IT 相关的东西, 比如电子产品或不同的网站, 但是如果是自己去做, 那大多会变成一件痛苦的差事, 特别是在国内大部分工作都是需求驱动而非兴趣驱动的情况下. 曾经 YY 是不是可以去当动车司机, 好像一个月也是有大几千块的, 不过后来想想这样的话一直在跑的其实就是那么一两条线路, 看的都是一样的风景, 也没啥好玩的了, 除非是可以经常去添乘其他线路的机车, 站在机车视角看世界是挺有意思的, 但是也有很多维护工作应该也不那么好玩吧, 所以还是站在列尾用照片来忽悠自己好了.

用工作维持生活, 同时去追求爱好, 感觉这才是一个比较理想的生活, 但是其中也有一个太难把握的平衡点, 就是工作到什么程度算是维持生活? 不是官二代不是富二代, 买不起房开不起车, 要如果一直这样蹉跎下去, 估计爱好也只能慢慢变成 YY 吧. 但是如果是工作狂那样, 有很多事情也并非自己喜欢, 强迫自己一直跑一直跑, 又能怎样, 也许跑到某个地方停下来, 却发现自己早已忘了为什么要跑, 那跑到这样的一个点又有什么意义呢.

死局, 貌似还是在 YY 啥都不干光玩不干活的生活嘛, 先到这里, 最近几天把这个问题理顺了再想想什么才是自己想要的生活. (未完待续)

工作是为了什么? (1)

填坑, 之前预告过的 “是为兴趣而工作, 还是工作只为糊口, 而兴趣在别处”

首先, 先回忆下自己到底做过什么称得上是工作的事情.

2006, 在 KO, 小强, 高杰完成 WOJ 的第一版 noah 后, 自己做了一套 UI, 该 UI 后面一直被沿用至今, 无聊的群众可以去 http://acm.whu.edu.cn/learn/ 围观, 当时由于没找到漂亮的中文字体, 又不愿意大量用图, 所以当时尽量用英文, 估计不少人看过那个语法错误百出的版本后骂过设计者的英文水平.

2006~07, WHUACM 的负责人, 完整组织过一次华中区邀请赛, 组织出过一次题, 就那么几个人, 也还把事情做了, 也忽悠到后面有人愿意延续, 自认为还不错.

2006~09, 珞珈山水程序站务, 兼任过一段时间的管理站务和美工, 打杂看场居多, 主要是维护稳定性, 几乎无创新, 不过倒是对一些 *nix 的乱七八糟的应用了解了一点, 感谢那台蹂躏我到死的 SUN Fire v880 + Solaris, 以及 KBS 的各维护大神以及前世今生的各开发人员贡献的高质量框架.

2007, 百度 CPRO 实习, 当时时间比较短, 只有两个月, 所以酱油成分居多, 主要是大致明白了文本广告 (Contextual Ads) 的处理流程, 了解了一点关键词提取 (Keyword Extraction, KE) 的技术, 然后做了一段时间的人工评估.

2007~08, 谷歌上海工程院实习, 持续了接近四个月, 中间在做谷歌资讯的正文识别优化和相关性优化, 也非常酱油, 主要是那个系统已经稳定运作了那么久, 加上 Google 的基础技术确实非常强大, 也没有什么好改进的, 自己发现的几个需要改进的点跟进了一段时间后, 发现其实是早就有人发现过的坑, 但是因为 Google 做什么都希望做到 I18N, 然后语言一复杂系统就不可控了, 所以都没人去碰那个烫手山芋, 自己到最后果然也还是没有作出任何本质改进. 期间把整个新闻搜索的抓取/析取/分类等过程大致了解了下, 然后乱七八糟学了一些基础工具和基础知识.

2008, WOJ v2.0 (flood), 跟 ooeyusea 还有 magiii 三个人一起把这个 ACMer 重复发明了无数次的东西再次发明了一次, 自己做的是 Judge 内核, 当时向 xuchuan 和 sempr 等人学了不少东西(部分是偷学), 对整个系统的架构提出了不少目前看来也还是很赞的想法, 可惜的是最后整套系统的中心节点有莫名其妙无法复现的问题无法稳定运行, 最后还是被弃用, sigh.

2008, 本科数据结构课程的上机教辅, 这个没什么特别的地方, 让自己复习了下数据结构而已, 然后看了更多的 bug.

2009, 香港理工大学助研, 一开始是想在 Summarization 这个方向上搞搞看的, 因为老板就是做这个的, 但是后来发现我 Graph Mining 方向上实在是够迟钝的, 于是捡起之前在百度实习时的 KE, 埋头在这个上做优化, 最后硬是把 Graph Mining 和 KE 给搞到一起去了, 结合所谓的社交化趋势, 在论坛等有回复引用等关系的页面场景下不同位置的话题焦点因素引入 KE, 最后成功灌水一篇,不过会都没去开, 活这么大唯一一次有脱离大中华区的机会也没走成.

2009, 微软亚洲研究院实习, 优化一个几年前本质是以图搜图的Best Demo 的性能, 以及寻找该 Demo 的实用化路线, 这里又要把无敌的小强同学再次拉出来, 因为这个 Demo 最早是他实现的, 传了这么多年还是这个样子, 在我手上最后也没能优化到一个能大规模工业化应用的程度, 足以见得小强的强和笨狗的弱, 中间大概明白了所谓的K-means 聚类以及图片内容搜索到底是怎么一回事, 然后无聊自愿去做了一天Vendor 的活去在北京的地铁站里转了一天拍素材, 但是最后实际也只看到了问题表现,没能明白问题本质, 图像特征点提取算法也没看懂.

2009~11, 百度凤巢策略实习/工作, 一开始在做查询语句到关键词扩展的机器学习模型优化, 学写分布式程序 (这个其实本该 07 年在 Google 学会的), 写特征提取框架, 看 Logistic Regression 看到后面自己都晕了也没真正去实现过一次, 主要还是工程方面的工作, 以及一些鸟枪法的特征筛选, 到后面积累到足够多感性认识可以有针对性的优化模型特征集时, 已经没太大优化空间, 而且自己也因为整个大组的重组而换了方向. 换方向后做的是个性化投放, 简单来说就是根据用户特性进行有区分的广告投放, 有人喜欢广告那就给他多出点, 有人不喜欢就少出点, 最好是还能做到更精确的意向识别, 比如某人是做机械产品的, 那电子产品的广告可以给他少出, 而机械方面的可以多出, 但是这个方向在最简单的第一版准备实验时因为要回学校毕业而转手出去, 其实这中间大部分工作还是在做数据积累的调研, 以及工程实现, 对万能的贝叶斯方法初窥门径. 从学校毕业后正式入职, 一开始在做广告客户的转化率优化方向打了段酱油, 还是在做模型的特征提取, 因为之前有做过相关的工作, 所以这边稍微快一点, 但是那个 python 框架最后还是被改成了 C/C++ 的, 因为要跟别的东西兼容, 而公司里是没有官方使用 python 的, 自己调研的程序除外. 然后被卷入整个大组该年最高优先级项目中, 做广告竞价中的计费优化, 为了响应该项目不同时期的需求而把优化方向改了又改, 受 xx 和 yy 两个坑爹的策略影响, 自己做的调研工作虽略有成效但还是无疾而终, 虽然现在又开始捡起当时的一些方向继续下去, 但是这是后话, 也跟自己没啥关系了. 在最高优先级项目上线后, 临时转去做了一把推词的工作, 大意是如果某人想做搜索引擎推广但是不知道买什么关键词, 我们根据他的广告跟别人的相似度给他推荐相关的广告关键词, 没太多技术含量, 救火队员性质的活. 再后面就转来挖现在手头这个坑, 自动出价, 听起来巨高科技巨科幻的一个功能, 事实上做的我整个人也科幻了, 第二次把一个前无古人的功能从头实现到位, 恶心吐了, 目前这个坑在开始出成绩了, 希望结果能好看点, 别跟以前的坑要么做完了就啥都没了, 要么转手给人了, 要么, 要么直接就莫名其妙的没了, 无声无息的没了…

####

太累, 今天写到这里先, 明天继续写 “自己感兴趣过的事情”, 从大学开始几个关键词应该是 灌水, DIY, WebUI, 魔方, 铁路, 成仙了一样的无欲无求浑浑噩噩

春运不观察了

完全看不懂的大盘

1/25 L415 这车居然改不到硬卧, 那票都哪去了? 难道今年宁局事先就联系人预订走了? 我去年坐的时候那么空的车让领导们怕了么? 只有在昨天和前天幽灵般的刷出来部分硬座和少量硬卧

京广长沙至株洲段居然都瓶颈, 看很多车在这一段加剧晚点. 株衡段更不用说了, 等级稍低或者已经晚点的就等着在这段上被踩到死吧 湘桂不到 60 的旅速让人情何以堪?

K21 居然连续几天不晚点的过去了,刚好赶上天窗前那一段? K157 这个悲剧在路上的遭遇我就不想说啥了

去西站送人, 表示看不懂西站现在的布局. 改签窗口人不多, 有黄牛明目张胆活动, 不过卖的是当天太原动车硬座, 没加钱, 还算厚道. K157 和一堆临客被扔到了北二出口改的临时候车室, 提前一个多小时就放人上车, 站台票能送人上车, 距开车还有一个小时硬座车厢的过道就挤满人了, 上车前列车员特别提醒记得挤下来, 不然一开车最近的站就是涿州了. (其实涿州不算远吧…)

2010 百度年会笨狗记录版

0x00 开场前大组 building, 都能坐满六桌人了, 贵组越来越威武了
0x01 因为某某原因, 笨狗拿的内场票, 前区最右边, 视野还行 (相比较外场应该是很不错)
0x02 前面是日本市场和 SEM, 看到一个穿的跟COSPLAY 一样的日本帅哥, 一头银发, 传统服装, 木屐, orz
0x03 更赞的是本来以为那个日本 GG 是要表演的, 结果人家一直就坐那, 这就是泥轰朋友的正式场合装束?
0x04 日文的同学看起来都非常有礼貌
0x05 开场拉歌感觉不够热烈, 跟首体太大, 大家坐得比较开有关, 也跟各部门也不知道自己应该跟着哪个拉有关
0x05 Jennifer 开场的气球没看到, 因为被拉去后场 -___-||
0x06 因为坐在做靠边上, 所以被工作人员拉去当互动嘉宾 (俗称 “托”), 看了下问题对了下词, 就是帮引出节目的
0x07 之所以临时被找去是因为他们本来找好的人坐的位置太靠中间, 主持人过不去 -.-
0x08 要 “采访”我的居然是 ECOM&BIT 的 lili… 一开始看见差点没认出来, 这舞台上的妆也忒厚了吧
0x09 原来我们只是三个最佳团队中的一个, 而且也不是最高奖, 还以为是最好的那个呢
0x0a 最佳团队的视频感觉我们那个是最无聊的… 远没其他两个好玩
0x0b 而且最后那个集体背景跟我想的不一样, 果然站歪了, 不过导演不是重拍了次的么?
0x0c 说到这个, 内网上的团队合影我不是最后也赶到拍了张的么, 怎么放的还是没有我的 T__T
0x0d 原来最佳新人, 最佳百度人, 最佳经理是有一块单独区域的, 那果断没有我的份, 羡慕嫉妒恨啊
0x0e 对 “给力时代”表示非常不适应这种狰狞的风格, 听着心里就扭曲
0x0f “盘古大家一起来”, 歌很好听, 说体验中心时我看了一半才发现好像是说客服, 一开始还以为说 UE
0x10 “一封家书” 开始前被采访, 据说这个托当的还不是那么明显?
0x11 坐下后旁边同学立马问 “是不是托是不是托”
0x12 同时收到若干短信问同样问题
0x13 节目内容还挺不错的, 只是为啥 “摆渡” 这个段子每年都要吐槽好多次? 未灭我从来没有这样的联想
0x14 “我”, 其实没太看懂
0x14 “非二勿扰” 感觉还是不咋好玩,没咋看过原版节目, 看的都是恶搞版, 好像去年毕业时学院晚会那个更给力
0x15 “你踩我裙子了”, 法务部反串的那个 GG 下台时的这句话好多人听到了, 到处在风传, haha
0x16 刘惜君, 不熟, 第一反应是有点像李冰冰, 第二反应是这不是以前 momo 他们很推崇的那个超女么?
0x17 “百度时代”, 挺恶搞的, 不过觉得里面搞国内某几个互联网老大的时候有点过分了, 这样不太好
0x18 “超级变变变”, 感觉这个现场效果不太好, 至少很多人表示那个有啥意思…
0x19 “神曲联唱”, 既不追 LadyGaga 也不听 Poker Face 更不喜欢忐忑的笨狗表示这个恶搞不属于我的恶趣味
0x1a “高管联唱”, 事先听过点风声,没有太大的惊喜, 不过还是很好玩的, haoyu 的唱功挺好的
0x1b Jennifer 出来 There is a zombie on you lawn 时觉得好萌啊好萌啊
0x1c 当然某狗也很不厚道的脑补了 “草地上有一只怪蜀黍” 的歌词
0x1d “剩女奇缘”, 挺好玩的, 总觉得那个女主角 MM 好像我以前的某个同学, 但是我认识的是谁我都忘了, 囧
0x1e 里面的 “吸烟有碍健康”吐槽太狠了
0x1f “盒子里的梦想”, 这个就是最佳节目啊, 无论什么方面都非常非常的赞
0x20 好像我去过七楼那个厕所, 是才搬来大厦某人还没入驻时, 去还在装修中的那边完整的溜达了一圈
0x21 年会中对 “给力”这个词恶心到吐, 而 “你懂得” 目前觉得还有萌的属性
0x22 “舞蹈”, 这个我不懂… 也看不出哪里出彩哪里一般, 请无视我
0x23 羽泉, 这个全场 high 到爆啊, 不过羽凡堵车迟到这个太囧了
0x24 海泉到底还是见过大场面的人, 拖时间也非常有水平, 相比较而言主持人就被吐槽的太狠了
0x25 全场清唱时, 都有种在演唱会现场的感觉, 气氛太好了
0x26 其实其他节目时能跟着吼的我也都在吼过 -___-b
0x27 跳上去那么多人估计海泉也没想到吧, 根据羽凡后来的描述, 估计有两三个人就能扛到他出场了
0x28 羽凡到后气氛更好, 最后奔跑时下来绕场一周这个太high 了, 不知道老大们对年会变个唱有没表示不满, hoho
0x29 抽奖还是没我的份啊, 不过罗老板事先说不管谁中奖都要bg 全组, 纪念奖也要 bg, 这个太狠了
0x2a 期待中了纪念奖拿俩兔子的晓宇 bg, hiahia, 这俩兔子真贵
0x2b 感觉抽奖整体不给力, 人少东西也少
0x2c 不过根据推上说法, 年终奖的公司 KPI 系数超过一了, 不知道最后到手能有多少

Appx. A 年会没抽中奖, 不是最佳新人, 也不是最佳百度人, 只在最佳团队中酱油路过, 笨狗仍需努力
Appx. B 盒子里的梦想优酷地址: http://v.youku.com/v_show/id_XMjM4OTA1NzI4.html 强烈推荐

春运观察 1/21

首先提供几个查信息的官方网站:
www.12306.cn 铁道部的官方信息平台, 可以查票价/余票等, 有技巧的还可以通过这个查临客开行
www.ht1881.com 广铁集团的官方信息平台, 但是不知道为啥一直很低调, 可以查广铁境内的车次/编组/正晚点等
http://www.jtkyw.com 济南铁路局的官方信息平台, 可以查过济局范围的车次编组, 正晚点信息
http://www.whrailway.cn/ 武汉铁路局官网, 查新开临客, 余票 (不定期更新) 等信息用

然后观察下北京往我家 (湖南永州) 方向的情况

从现在开始北京始发 K21/T5/K157 几乎是不太可能弄到票的, 在开车的前一天晚上有可能刷出 K21 的硬卧或软卧, 打算孤注一掷的同学可以去试试看, 或者可以想办法先混到武汉, 然后在武昌买 K21 的对号硬卧, 提前一天的时候会放大概 12 张出来

1/25 和 1/31 凌晨 3:25 会加开 L415 北京西到南宁, 根据以往经验, 1/25 那天的车非常好买, 卧铺大把, 对时间要求不是特别严格的可以考虑, 我个人觉得还是很划算的, 不用半夜去排队冻个半死, 多耗费的十个小时反正也是在车上睡觉, 而且这车因为时刻表排的很松, 怎么着都不晚点, 可惜现在改空调车票价也贵了不少. 但是线路是很飘逸的走京九(北京西-麻城)/麻武(麻城-武汉)/京广(武汉-株洲)/沪昆(株洲-娄底)/洛湛(娄底-永州以南)线, 道县以南我就没关心怎么走了, 而且路过武汉, 在汉口和武昌都有至少十几分钟的技术停车, 但是不上下客, 硬卧限售株洲还是永州以远, 去 长沙/株洲/娄底/邵阳/永州/道县 等地方的人强烈推荐, 到永州以近的可以多花几十块钱买到永州的硬卧, 总比贡献给票贩子划算, 注意去 12306 看好此车时刻和停站情况, 有一些站是只路过不停车的 (比如武昌和汉口)

从 ht1881 的正晚点数据来看 (刚发现这丫直接改名叫 晚点查询 而不是 正晚点查询了…), 最近两天 K21/T5/K157 在湖南境内均有 1-2 小时晚点, 估计跟最近南方大雪有关, 从天气预报来看后面几天也很不靠谱, 准备卡点回家吃饭的最好还是准备好在火车上多一顿的口粮

春运观察 1/21

首先提供几个查信息的官方网站:

www.12306.cn 铁道部的官方信息平台, 可以查票价/余票等, 有技巧的还可以通过这个查临客开行
www.ht1881.com 广铁集团的官方信息平台, 但是不知道为啥一直很低调, 可以查广铁境内的车次/编组/正晚点等
http://www.jtkyw.com 济南铁路局的官方信息平台, 可以查过济局范围的车次编组, 正晚点信息
http://www.whrailway.cn/ 武汉铁路局官网, 查新开临客, 余票 (不定期更新) 等信息用

然后观察下北京往我家 (湖南永州) 方向的情况

从现在开始北京始发 K21/T5/K157 几乎是不太可能弄到票的, 在开车的前一天晚上有可能刷出 K21 的硬卧或软卧, 打算孤注一掷的同学可以去试试看, 或者可以想办法先混到武汉, 然后在武昌买 K21 的对号硬卧, 提前一天的时候会放大概 12 张出来

1/25 和 1/31 凌晨 3:25 会加开 L415 北京西到南宁, 根据以往经验, 1/25 那天的车非常好买, 卧铺大把, 对时间要求不是特别严格的可以考虑, 我个人觉得还是很划算的, 不用半夜去排队冻个半死, 多耗费的十个小时反正也是在车上睡觉, 而且这车因为时刻表排的很松, 怎么着都不晚点, 可惜现在改空调车票价也贵了不少. 但是线路是很飘逸的走京九(北京西-麻城)/麻武(麻城-武汉)/京广(武汉-株洲)/沪昆(株洲-娄底)/洛湛(娄底-永州以南)线, 道县以南我就没关心怎么走了, 而且路过武汉, 在汉口和武昌都有至少十几分钟的技术停车, 但是不上下客, 硬卧限售株洲还是永州以远, 去 长沙/株洲/娄底/邵阳/永州/道县 等地方的人强烈推荐, 到永州以近的可以多花几十块钱买到永州的硬卧, 总比贡献给票贩子划算, 注意去 12306 看好此车时刻和停站情况, 有一些站是只路过不停车的 (比如武昌和汉口)

从 ht1881 的正晚点数据来看 (刚发现这丫直接改名叫 晚点查询 而不是 正晚点查询了…), 最近两天 K21/T5/K157 在湖南境内均有 1-2 小时晚点, 估计跟最近南方大雪有关, 从天气预报来看后面几天也很不靠谱, 准备卡点回家吃饭的最好还是准备好在火车上多一顿的口粮