Year: 2010

每日愤一句: 很多事并不是非对即错的 [1]

最近互联网很热闹, 帽子也很多, 鉴于某狗向来喜欢凑热闹又喜欢插嘴, 帽子更是被扣了一顶又一顶

主流的逻辑有这么一条: 反对 Google 的一定就是五毛, 一定支持 GFW 和网络审查

这个是不是有点太偷换概念了? 我喜欢 Google, 但是不爽 Google 这次的行为, 反对 GFW, 支持有限度的网络审查 (比如现在谷歌在香港的安全搜索, 屏蔽色情和暴力), 那我算啥? 到底是五毛还是七美分?

为啥这个世界上很多事情明明不是二分类的要被逼成二分类? 这又不是非对即错, 又不是试卷上的判断题, 而且就算是一个判断题, 比如是否支持谷歌退出中国大陆这一个问题上我选择支持, 那又如何? 你怎么知道我为什么支持他走?

ps. 诚心求五毛或七美分编制, 本人长期从业 IT 相关, 曾在 Google 和百度实习, 可以爆更多猛料

碎碎念 2010/03/19

0x00. 半天能搞定的事情做了两天, 终于做完了, 那啥, 与啥斗其乐无穷来着
0x01. 其实大家都可怜, 大家都缺人手, 看着四个 OP 给我们四十几个人上东西, 还这么快的迭代策略, 也难为他们了
0x02. QA 老大昨天跑过来溜达, 大家互相诉苦, 期间某人突然来一句 "我要插一个模块去测试", 那一瞬间, 我分明看到了 QA 老大眼里飙出的浓浓杀意
0x03. 很多看起来毫无联系的事情, 其实是有联系的, 比如武广高铁开通和武大的樱花节, 据说现在很多珠三角的人跑去武大看樱花了, 所以为了避免过多无痛的人流, 是不是应该把门票加贵点, 让人流们都痛一下? 不然珞珈山樱花园人实在是忒多了点
0x04. 3/14 其实还是另一个神奇的数字和日子, 不知道做 WOJ 的人是否还记得 TLE 会超多少, 那就是第一个写内核的人的生日, 哈哈哈哈 (不是我)
0x05. 更新了下星际大脚, 现在改 AI 做的很自动化了嘛, 还能选族, 不就跟单机版差不多了, 只是地图少了点
0x06. 江南此时应该早就春暖花开了, 而北国还是一片荒芜, 前几天晴了下, 这两天又都灰蒙蒙的了, 据说有沙尘暴?
0x07. 暖气似乎也该被停了? 还好现在天气已经暖和, 晚上睡觉一定要关门啊, 不然有暖气也还是冷了点
0x08. 无聊理工男们总还是能从无趣的工作中找到无尽的萌点的, 唉, 生活还是要这样穷开心下, 不然过的也忒惨了
0x09. 看了下那个 81 年的美女漫画家夏达, 果然是太震撼了, 素颜时也还是很萝莉的嘛…
0x0a. 还有天涯上那个飞屋, 直接导致小强反思其生活没有目标, 做的太华丽了, 所以我昨天去把 SketchUp 又下载下来并装上, 今天跟原作者要到飞屋的 .skp 和 .skb, 做的还是很赞, 我还是先看看能不能把现在住的这个房子给建模吧
0x0b. 昨天跟同组的同学吃饭, 被问说实习赚这些钱都去哪了, 想了下, 好像也没干啥, 没玩啥大的, 也没买啥大件东西, 就这样交点学费, 自己生活费花花就没了
0x0c. 还是说实习, 说这样过的是不是太累了… er. 这个我能说啥呢, 其实我还是懒人一个, 只不过, 起跑线就这样了, 也只能笨鸟先飞笨狗先跑了吧
0x0d. PayPal 这个流氓, 注册居然都要收 1$, 然后验证卡又是 1.95$, 最可恨的是招行还是没给我在系统里生成对应的账单, 虽然邮件里有, 但是就是没找到 PayPal 说的那四位验证码
0x0e. 一定要把 TopCoder 上那几毛钱要回来, 不能进行无谓开销了, 然后 TopCoder 的人也不理我, 无语
0x0f. 又会是一个加班的周末, 不过还好, 终于能踏实点睡懒觉了
0x10. 大家周末愉快, 春暖花开正是春心萌动好季节, 出门看能否碰上那个 TA, 或者牵上你那个 TA 出去玩吧

碎碎念 2010/03/16

0x00. 两个星期了, 终于有一个实验结果是正向的了, 泪流满面, 虽然这个结果最后会因为别的因素还是会被砍掉
0x01. 昨天跑去和 zouyu 吃饭, 顺便参观 IW, 结果饭间被老大电话殴, 说上线都没上完怎么就跑了… 那个明明是都做了无数次的操作了, 而且两个单合一起, 我都找人托管了
0x02. 连 IW 的电脑都比我们的好, 泪奔啊
0x03. 可怜的熊被 IW 三人轮流洗脑… 要不下次把 zouyu 拉过来被我们洗一把?
0x04. 昨天上午都在很纠结的写邮件, 给人发好人卡也还是一挺纠结的事… (此处被发卡的不是自然人…)
0x05. 然后答应给人 MM 介绍 BF… 看我多么一助人为乐的好青年
0x06. 周日称重, 终于回到 65kg 以内了, 希望 fm 家的秤不是有问题的
0x07. 食欲回归, 淡而无味的心情终于过去, 少纠结多干活, 能吃能睡能干活才是王道
0x08. 一个人住确实还是懒了很多, 回去后太安静所以都很晚回去, 然后继续说自己没时间搞卫生, 洗衣机漏水的毛病想过也没弄, 加湿器不出雾也没去再折腾
0x09. 周日下雪, 周一就晴空万里, 如果我不睡那么晚, 清晨的阳光还是多美好的, 只是现在都是明晃晃的把我从梦里照醒
0x0a. 我度股价直有甩开 GOOG 的态势, 可喜可贺, 可惜现在新员工还是一股都没, 不然给个 100 股都快够首付了
0x0b. 很 ws 的说去给 g.cn 献上五毛一张, 后来还是觉得不如拿去坐公交更有实际意义, 作罢
0x0c. 最近几个日子都很有意义, 3.12 植树节, 我们写下一颗二叉树… 3.14 没有情人的宅男们好好过 Pi 节, 3.15 居然能发现用 HP 本的人所在宿舍一般蟑螂会比较多, 3.16 实名制五年?
0x0d. 貌似如果还在武大, 这时候已经开始疯狂腐败了吧? 吃饭的高峰期要来了, 啥时候还是去趟南京或者上海? 哥们几个再去搓几顿?
0x0e. 据说武大的樱花要开了, 不知道为啥, 突然就想起来东邪西毒里说桃花的那一段
0x0f. 只可惜一直到在武大最后一年, 也没能在入夜后的橘黄路灯下, 能有人携手在樱花大道缓步而过, 看落樱缤纷, 看人面桃花更羞媚
0x10. 装纯情完毕, 回归死宅男, 打的回家, 洗澡睡觉去

碎碎念 2010/03/14

0x00. 今天 Pi 节, 3.141592653589793, 只能背到这里了
0x01. 今天白色情人节, 貌似也没人给我送巧克力
0x02. 今天出门时间不到十分钟, 就下楼买了几个鸡蛋和青椒
0x03. 连续五天没上班, 心玩野了很多
0x04. 感觉还是很对不起某 HR 的, 出去白吃白喝白玩… 虽然事先说好了这事和另一事无关
0x05. 大家终于都从前段时间那个大坑里跳出来了, 不过确也不知道接下来做啥了, 大量的前期调研都是负向结果, 好伤心
0x06. 跟胡杨一起觉得某人好腹黑… 大家都被表象骗了
0x07. 昨天下午一句话就跑飞鼠家去三国杀和杀人了, 半夜两点走人回家, 人少了杀人还是不好玩
0x08. 过了这么久, 再跟 feli 同居一室, 居然还能半夜扯到三点多, 而且都没有任何 ws 的话题
0x09. 认识了很多很有意思的新朋友, 再次强烈鄙视某掌公司今年的校招政策, 放走了多少有潜力的人啊
0x0a. 不过跟不少人说过自己的纠结后, 大部分人还是觉得我这样的情况应该留在某掌
0x0b. 昨天半夜写周报时才发现, 似乎上周啥事都没做成, 只上了两天班, 其中有一天还是在不断的谈人生谈理想中度过的, 剩下一天做的事情全部负向结果
0x0c. 北京又是大雪, 还好周五回来洗澡之前看了天气预报, 英明神武的继续穿着保暖内衣, 不然明天早上就傻叉了
0x0d. 系统还是总有点奇奇怪怪的小毛病, 在考虑是不是找个良辰吉日重装算了
0x0e. 小强是个勤俭节约的好人, 居然让我把北京的路由寄去上海… 虽然说我也只有电脑要上网, 但是拖根网线明显要不爽很多…
0x0f. 响应号召写满 0x0f
0x10. 无聊进一位玩玩

碎碎念 2010/03/09

0x00. 北京下了一天大学后立马变成晴空万里, 含冤得雪?
0x01. 貌似要干一件非常伤 RP 的事情…
0x02. 今天一天基本上就是在跟各个老大谈人生谈理想… 好困
0x03. 又来 "你看你当年就不该回去读研的" -______-||
0x04. 最近一两周的工作很不顺心, 感觉是那种奇怪的瓶颈阶段, 想法都不奏效, 也没别的好的 idea 出来
0x05. 所以可以安慰自己出去散心换个环境思考下问题也是个不错的选择
0x06. 开始觉得一个人的孤单, 了无人气自己会不会变得越来越孤僻?
0x07. 睡眠不足?
0x08. 缺乏锻炼, 周末去游一次泳, 大部分时间都只是泡着而已了, 体力明显不行加上怕抽筋
0x09. 我是永远向着远方独行的浪子

统计学时代

// 友情提示, 本文又意识流了, 不喜欢这种风格, 不想大脑被打结的请绕行

昨天跟着一群无聊的人一起看腾讯 QQ 在线超过一亿, 峰值大概是 103.29M 的样子, 又是一个新的统计学时代的标记.

一亿同时在线, 意味着什么? 就算我们考虑上那些无聊开 N 个 QQ 挂着的, 就算考虑上那些开着 QQ 但是人不在电脑前面的, 就算加上越南版南非版等大部分人闻所未闻的奇怪版本, 这个数字还是异常夸张的. 同时还可以看到 QQ 游戏最高有 625 万同时在线, QQ Live 最高有 301.9 万同时在线. 在对特殊个体提供服务的同时, 很多策略都更多的是考虑大部分人的需求了. 拥有这么大的用户群, 真的是插根筷子都能发芽, 竖根扁担就能开花. 看看 QQ 影音, QQ 拼音等产品现在的装机量, 再想想现在腾讯还在憋的那些产品, 包括已公开的包括影像医生, 和只是招聘信息里泄漏出来的杀毒产品, 真的只能感慨以后除了微软, 是不是整个桌面都会交给腾讯? 至少目前, 我的机器上的绝大部分都被这两家占据了, 操作系统用 Windows7, 办公软件用 Office 2010, 杀毒用 MSE, 听歌用 WMP, 沟通用 TM, 输入用 QQ 拼音, 看电影用 QQ 影音, 下东西用 QQ 旋风, 管理软件用 QQ 软件管理器, 为了应付大陆太过猖獗的流氓软件而用 QQ 医生, 不多的非 M 非 T 的有 Chrome (虽然我也同时用 IE8), SecureCRT (这个没找到好的替代品), WLM/Hi/LibFetion 几个 IM, Adobe Reader, 7zip, 金山词霸 (这个其实用的少了, 只是装着)

前面那些都是没有联系和实际意义的感慨, 真的感慨是在实际的数据上做了这么久的数据挖掘和机器学习后改变的世界观. 以前总以为学习应该是攒够感性认识后再积淀抽象成理性认识这样的过程, 而经典的知识大部分确实都是这样得来的, 而以前所谓的量变引起质变, 说的大概也就是这么一回事. 但是在信息爆炸数据狂潮里, 要想再这样从感性认识提升到理性认识这个过程实在是太慢了, 我们需要大规模的数据挖掘和机器学习方法来加速这个学习过程, 而这个过程给我的感觉更多是不可控的 :( 并不是说我不明白里面的原理, 特征, 拟合方法等完全看不懂, 而是在海量数据上, 直观感觉往往并不靠谱了, 加上数据分布和数据噪声可能远不是我们想象的那样, 直观上的感觉在最后只会错的更离谱.
按照官方的报告, 中国大陆网民已接近四亿, 其中百度的用户有 80%, 那么保守估计一天里会有至少一亿独立用户会访问百度并进行搜索, 这里说的是一亿的独立用户, 他们的搜索行为绝对远不止一亿, 那么在这一点上, 每天积累的用户数据也是难以想象的海量. 互联网发展到现在, 包括信息检索等技术发展了这么久, 很多直观的规则系统都已经被几乎榨干了潜力, 再想提升就只能去分析用户们各种行为下暗流涌动的奇怪特性, 从而提供更贴近大多数人需求的服务. 这里有一个比较有意思的点, 正如最前面说腾讯的时候说道的, “大多数人需求”. 到了这样一个统计学意义上, 除非一些特别恶劣的特殊情况需要保证一定要纠正, 剩余的已经不能拿抽样来很好的说明问题了, 除非抽样能足够大, 而且抽样后的评估也能完全模拟千奇百怪的网民行为, 否则抽样并不能很好的说明问题, 而最终反应在统计层面上的使用率等才有参考意义.

刨开那些简单的用规则和用机器学习实现没区别的简单特性, 在超大规模的数据下, 越来越觉得机器学习的不可控性越来越大, 很多直观的想法一经实现都会发现只有负面效果, 而很多无心插柳的改进都很不好从前往后推, 只能从结果来分析原因. 我讨厌这种不可控的感觉, 虽然很多时候可以解释成我们的想法太 geek 太高端, 虽然说我们已经努力降低 IQ 下限去站在最广大网民的角度去思考问题但是还是不够, 但是, 在一直出现与预期相差甚远的结果时, 总还是会有那么一点抓狂那么一点沮丧. 虽然还是坚信这个世界总是可以通过可以描述的规律来解释其运转的, 但是发现这样的规律已经越来越飘渺, 越来越不被我等凡人所能理解和掌控.

在互联网这个用户可以完全放心用鼠标和键盘投票的地方, 好和坏还是很容易区分的. 在把基于规则的经典方式做到极致后, 只能通过引入基于学习的方法来提升效果, 而在极致上再做调整, 任何的扰动可能都会带来无法想像的后果. 一直认为, 企业如果需要建立在海量用户上, 那么用户信息便是一个绕不开的巨坑, 此用户信息不一定是用户的具体隐私信息等, 而只是一些使用习惯或其他的行为统计数据, 而且这些数据应该是非特定指向的, 即里面的每条信息的置信度大致一样 (由于需要处理作弊等特殊情况, 不能说完全同等置信度, 或者说经过数据清洗后, 置信度会完全一样). 像 Google 百度这样有传统的搜索引擎很难撼动就在于其拥有的用户数据太多, 很多可能带来扰动的因素都已经被他们纳入机制内, 而后来者如果需要追赶, 也只能是走一样的路, 但是在市场已经有领头羊, 这些数据是否还能有同等置信度就很难说了. 比如谷歌中国累积的那么多数据, 是否就能推广到 80% 以上的中国网民上? 用大多数是受过高等教育, 且学术和政治倾向明显的用户产生的数据来推广, 也只能在同类用户群上获得更好的效果吧?

把视野放开来, 在 SNS 上如果进行充分的数据挖掘和学习, 最终对用户的反馈到底会是怎样? 是会由少部分的先进生产力带动整体, 还是大多数的白痴会传染以致整体越来越白痴? 不过应该还好, 他们的一些基本规则还能在机制里生效, 很多底线最好还是不要过的好. 在桌面软件领域, 如前所说, 腾讯的那么多用户可以一直很快乐的做小白鼠, 在给腾讯提供足够的直接反馈的同时也在统计意义上给出更多的功能取舍选择, 微软和 Google 经常说取消某功能的理由也是 “绝大多数用户不用而且这个功能确实没太多用”, 在这样的迭代速度下后起之秀们估计很难壮大起来了, 毕竟现在技术壁垒已经越来越低, 而用户和数据壁垒越来越高, 而且只要有壁垒的一方不自杀, 那这个壁垒只会继续高下去, 而丝毫不会降低.

就在写到这里的时候, 抽开去看了下说 “360 安全恐吓” 的无敌招数, 这个也算是一个学习和规则并存的产物吧, 看多了 QQ 群里 “xxxx 就送 10 QB” 这样的骗子自然知道是骗子, 但是就这种雉还是会越来越多, 那么从统计意义上这个方式就还能继续生效, 然后只要对这样的方式进行微调, 也许又可以推广到别的领域继续兴风作浪 (比如 360 的安全恐吓?).

在用户的整体素质没得到提高之前, 统计意义上为贴近用户的改进大多还是只能让用户的整体素质越来越低, 做的越好用户则越脑残, 而研发人员只能跟着越来越脑残, 因为统计只能统计过去, 无法预测将来. 而只有在新规则推动下才可能带来革命性的进步, 比如在 iPhone 之前触摸操作为什么就没法这么普及? 比如 Gmail 出现前为什么邮件就必须是一封一封的组织而不是会话模式? 还有 Tag 之类的功能, 无法仔细考究谁提出谁推广. 一般的企业会在已有规则上墨守成规最后把自己做死, 稍好的会在已有规则上用统计学习去让已有规则领域做到极致, 而真正能长盛不衰的企业应该是用新规则去开拓新领域, 等把开荒的暴利赚够后把这个领域扔给后面的二三流企业跟进, 自己再去开辟新时代. 做技术做科研同理, 在攒够二三流能力之后还是需要去努力创新开辟新领域, 这才是傲视群雄的霸气. 以上, 与君共勉.

碎碎念 2010/03/03

0. 上次也就突然有空写一下, 果然没法维持每天一篇
1. 上次说完论文还没开始写之后, 当天晚上失眠, 然后脑子里把论文框架和大概内容想好, 第二天早上起来去公司把框架目录记下来
2. 然后周一晚上十一点多才走, 晚上回来继续失眠想工作的事情, 不知道某人会不会继续说我有工作狂的潜质 -.-
3. 昨晚半夜迷迷糊糊半失眠状态中被报警短信弄醒, ft, 然后继续没睡好
4. 早上起来立马调问题, 结果没收到预料的报警短信, 唉… 这知道有 bug 后, 调试的时候, 怕他不来, 又怕他乱来… 所谓少女怀春等情郎啊…
5. 算账, 算到最后自己都算晕了, 09 年 7 月到 10 年 2 月总支出居然有 58k, 能记起来对的上的大概有 50k, 然后 8k 估计就是吃饭打的买零碎了. 其中房租及相关开销约 25k, 不过因为多支付了整半年加押金, 这部分扣除 15k 好了… 还是好贵 T_T
6. 去打羽毛球, 很久不动还是比较累, 只是我还没像其他人会全身酸痛, 或者是因为我只是在瞎玩没投入?
7. 一个人晚上还是挺无聊的, 所以, 在公司加班也许未必是件坏事
8. 觉得好像有很多话说, 但是又想不起来
9. 加湿器坏了说打电话找保修, 说了一个星期了结果每天都忘记
10. 说给表哥帮买相机, 也拖了这么久没动
0x0B. 是不是装叉用下死程序员的计数方法?

碎碎念 2010/02/28

0. 今日元宵, 继续对此类日期没感觉
1. 因为太多人问是不是死了而不更新了, 所以念叨下
2. 其实记录是个好事, 不管是碎碎念还是记账, 今天晚上回去把从 HK 回来后的账理下, 然后开始记粗账, 回归规律的生活
3. 果然很久没记录, 现在翻开本子或者点开输入框, 都不知道要干嘛
4. 关注 SC2 的进展, 既然没有合法的 Beta Key 那就只能关注破解了. 今天试了下 1.0.0.4 的星际大脚, 可以自己造东西玩了, 继续对人族大爱, 雷神还是没有大和变态啊, 虽然那个 6 秒 500 伤害并锁死对方的技能也非常霸道, 可惜不能对空
5. 回北京后在享受暖气和阳光的同时也忍受干燥, 该死的加湿器被清洗了一遍后貌似坏了… 中间抽风好过一次, 但是无法复现, 能复现的只有挂了的情况
6. 回北京后吃坏肚子一次, 上吐下泻外加扁桃体和智齿同时发炎, 现在想吃啥就吃啥的感觉真好
7. 回北京后一个星期上班一直没太多动力, 昏昏沉沉的, 要振奋啊, 貌似 Q2 的工作计划已经出来了
8. 昨天被叫去 K 歌一次, 发现还是老歌比较适合我, 至少能嚎上去, 现在的那些歌手的歌要么不适合唱, 要么嚎不上去, 悲哀. // 老歌也不过是我的初中年代或以前吧
9. 昨天晚上在一家特色店见到一件 Geek Inside 的 T-shirt, 貌似可以无聊一下买一件穿来公司, 然后继续被众人 bs "无聊理工男"
10. 小强去上海了, 一个人住, 那么大的房子确实还是有点浪费, 不过貌似最近也没有合适的人可以合租的, 就这样耗到四月或者五月, 回学校时转人好了
11. 毕业论文的目录写了一半, 又没写下去了, 懒是个问题, 脑子没理清楚也是个问题, 估计等理顺了也就是一天一万字的速度? 翻译速度和打字的 APM 应该够
12. 越来越多的人, 特别是亲戚会关注另一半的事情了. 同时越来越多的朋友也开始被此问题纠缠… // 其实我什么都没想说, 只是觉得光阴似箭岁月如梭而已
13. 看到某人的签名档去看了看有道的上上签, 老实说我没看懂这个产品的理念, 感觉这个东西的负面影响会更大? // 强烈 bs 给我的那个签诗, 刚去换谱名看了看, 继续中下凶签, 太阳!!!
14. 废话不要太多, 保持更新频率就好… 在乎日期的人们元宵快乐~

[zz][Joke] IT 民工的悲剧

本文转载, 不过可以肯定的是, 那个十周年说的不是我现在这家

====分割线呀么分割线,咿呀咿呀哟====

发信人: pcman (好坑专家), 信区: Joke
标 题: IT民工的杯具
发信站: 水木社区 (Sun Jan 17 23:51:53 2010), 站内

新年一过,几个当码农的兄弟聚在一起吃饭喝酒打屁。

酒至半酣,大家不约而同的聊起了自己公司的前景

办过年会拿过阳光普照奖的都知道,从这个奖品中就能了解到公司现状

于是,小A无不得意的说:我们公司还是可以的,发了iPhone手机。

俺们一帮wsn那个羡慕啊

小B说:我们公司更好,发了一台Thinkpad X200。

俺们一帮wsn眼都绿了

轮到俺了,俺说:俺们最杯具,发了一台3、400的S40手机,唉,十年庆典啊,就发这个
,我们算是没救了。

小C这时候发话了

说:你不是最杯具的,俺才是…

俺们年会给每人发了一套杯具!

杯具!

杯具!


不要因为走得太远,就忘了当初为了什么而出发
我们并不是在表述某种存在,而是在努力寻找存在的原因
细节的细节就不再是细节本身
真实永远取决于观察主体
不要在生活中寻找你要的东西,而要努力感受生活中到底发生了什么

※ 来源:·水木社区 newsmth.net·[FROM: 114.250.157.*]