写博客有益身心健康
June 21, 2009 5:06 pm UTC | In Study | 5 Comments | hide几个月前看到一篇论文,大致是说写博客有益身心健康,Discovery 有个评论。博客和日记的功能有些类似之处,而日记的心理学作用研究由来已久,所以关于博客的心理学影响也不是什么新鲜研究。尽管如此,博客的公开化以及交互功能还是比日记要高出一个层次,所以我相信写博客比写日记(或限制访问的博客)应该是更有益于身心健康一些。写博客满足人的表达欲,有利于理清思路、消除孤独,并更有效的和朋友建立联系。
这篇论文所调查的人群是 Myspace 的一些人。在社交网络快速发展的今天,代沟也有了新的含义:我们常常以一个人在 Myspace 还是在 Facebook 更活跃来判断其属于“老人”还是“年轻人”。这篇论文的取样“N = 134, mean age 24.5 years”使得有人怀疑其取样的典型性。这是一个很有趣的怀疑,因为在很多研究中,取样的 bias 或者不正确的数据分析方法都有可能会倒置结果,但身在庐山中的研究工作者却不一定会意识到这一点。
一个例子是,很多微软的程序都会问你是否允许他们收集数据以便更好的改进产品,而这个反馈正是开发者决定工具条按钮顺序等一系列用户界面设计问题的重要依据。大神 delphij 曾提到,这个流程有问题,因为一开始的取样就是非常 bias 的,愿意被收集数据的用户是有一定特点的,比如心态比较开放、机器上没有敏感数据(不在大公司工作)。同样的,在软件开发中,用户反馈呼声最高的功能并不一定是最需要的功能,因为愿意参与反馈的用户群很小,并不一定代表整体利益。
现在很多领域的理工背景越来越重,强调纯粹的数学模型成为了一种趋势。几个月前,谷歌首席视觉设计师 Douglas Bowman 因不满公司痴迷数据而离职,他在博客中写道:
Yes, it’s true that a team at Google couldn’t decide between two blues, so they’re testing 41 shades between each blue to see which one performs better. I had a recent debate over whether a border should be 3, 4 or 5 pixels wide, and was asked to prove my case. I can’t operate in an environment like that. I’ve grown tired of debating such minuscule design decisions. There are more exciting design problems in this world to tackle.
我认为,这是一个很有意义的提醒。数字是会骗人的,解释其含义需要谨慎再谨慎。
因为类似的原因,总有人认为心理学全是骗人的。Sheldon 在 TBBT S2E13 中提到:“The social sciences are largely hokum.”不过,在大爆炸宇宙学也逐渐成为定量科学的今天,心理学依靠 fMRI 等也早已成为了一门可靠的科学。路易在物理学界打拼多年后涉足(物理)教育心理学,发现人思考量子力学和经典力学的时候 fMRI 很不一样。hmm… 不知道是不是骗人的,不过路易认为生物学和心理学的联姻将会像化学和生物学结婚生出了分子生物学一样伟大。
大神一二事
March 11, 2009 9:46 pm UTC | In Life | 6 Comments | hide- 某次和 delphij 以及某帅哥出去吃饭,席间 delphij 说到他前一天寄出了来美之后的第一封(邮政)信。帅哥问道:是不是寄给自己,内容是 test?
- 某次和 delphij 提到大型强子对撞机会不会把人类灭掉的问题,大神说:这其实是一个 feature。(请从宇宙宏观和进化论角度理解这句话)
- Google map 搜索 delphij near bay area,居然真的有……
好冷……Delphij 有向 Sheldon 发展的趋势。
Tags: delphij
有关用电
November 16, 2008 12:59 pm UTC | In Life | 8 Comments | hide
作为一个数字男,每天出门的时候拿手机给电表照张相(像右图这样),这样过一段时间就能拿来琢磨琢磨了。由于照片会自带 Exif 时间戳(同时可用来校正每日拍摄时间不同造成的误差),电表读数则可以通过图像识别或者直接肉眼快速读出,因此整个统计过程几乎可以全自动处理。下面这个图是统计出来的每日用电量。总的来说,还是比较稳定的,最后这六天在外地,果然省电……

昨天刚跨进家门就给 delphij 打电话,delphij 就我最近不及时更新 Blog 的问题表示了担忧。因此我今天更新一篇滥竽充数的,给伟大的 delphij 请安。
Tags: delphij, electricity
杂记
October 28, 2008 3:10 pm UTC | In Life, Study | 7 Comments | hide前段时间 Windland 问我:“你最近是不是出啥事了?博客都不写了。”我晕啊,我一向来是执行“有事写点,没事不用写”的政策;如果确实有事可写,那么再苦再累也要写!不过,既然 Windland 认为不写博客是不正常的,那么我今天就来粗制滥造一篇。
1. 关于能源
大神 delphij 说,他去过的机房有用 LED 照明的,走进去就像宇宙飞船一样。右图是我用 LED 照明用电脑的情景,看起来似乎还不错。
LED 的好处是,省电,耐用。关于省电这一条,将我最近听到和实测的有关内容罗列一下:
- 电器用遥控器关掉之后还会使用一部分电力,由于待机时间的比例很大,据估计,待机状态使用的电力大概占到电器总用电量的 75%。现在推行 ENERGY STAR,这个数字应该没有这么高,我估计应该在 50% 以下,但是这仍旧是一个不小的数字。
- 变压器空载(比如手机充完电拔掉但是充电器还插在插座上)的能耗很低,至少我实测过的七八个都是如此。我估计变压器空载耗电大概占一般家庭用电量的千分之一以下,所以大可不必麻烦去拔变压器。
- Apple 虽然在某些地方看起来似乎很不环保,但是在给 Macbook 省电这件事上,他们还是做的不错的。
- 美国 36% 的能源消耗 / 65% 的电力消耗是在 “Buildings” 这块(照明、空调等)。
- 半年里太阳输送给地球的能量,比地球上所有不可再生能源的能量总和还多(包括未开采的)。
- 太阳给地球输送的能量中大概有千分之一被植物光合作用利用并转化成化学能(biomass)。
- 光合作用能量转换效率大概是 5%,而现代太阳能电池板差不多可以到 20% 以上。
- 植物被动物吃掉后转化成动物体内化学能的效率差不多也是百分之几,也就是说,草食动物利用太阳能的效率是千分之几,食物链上越高,利用太阳能的效率越低,(由于能量守恒)这就意味着有更多的热能被生物排放从而加剧全球变暖。素食主义者因此声称,吃肉是不环保的……(其实算一下数字就知道,这个影响微乎其微。而大量发展畜牧业,牛羊放屁排放温室效应气体导致全球变暖倒是有一定的道理。)
2. 关于“这是一个 feature”
“这是一个 feature”,这出自客服对待软件错误的一种常用回答:“It’s not a bug; it’s a feature.”。大神 delphij 非常善用这个句型,比如:
atppp:节能灯泡亮起来有一个过程。
delphij:这实际上是一个 feature,晚上开不至于一下子很刺眼。delphij:绿卡和公民的区别是绿卡没有政治权利,不能投票也不能参加陪审团。
delphij:(停顿)这实际上是一个 feature。atppp:中国食品质量真可怕。
delphij:这实际上是一个 feature,我们下一代抗毒能力强,和美国打化学战必胜。
仔细想想,任何“Every coin has two sides.”的转折都可以用“这是一个 feature”来代替。比如我们实验室的对话:
C:网断了!
atppp:This is a feature,我们可以专心做实验了。S:仪器坏了!
atppp:This is a feature,我们可以休息了。
数字时代没有隐私
September 17, 2008 2:08 pm UTC | In Tech | 6 Comments | hide有这样一段聊天记录:
atppp: 唉,数字时代啊
atppp: 做事不留痕迹是不可能的
delphij: 数字时代没有隐私。。。
delphij: 所以这也是为什么需要有一台自己的服务器
伟大的 delphij 最后一句话逻辑似乎有点跳跃,不过不管怎么说,类似问题早在影片《手机》中就已经提到——张国立说:“还是农业社会好啊!那个时候交通通讯都不发达。你进京赶考,几年不回,回来以后啊,你说啥子都是成立的!现在……(掏出自己的手机)近,太近了,近得人都喘不过气来咯!”(1:22:00)
随便说一个问题:gmail 在一些浏览器的历史记录里会留下信件标题和 email 地址,比如我的 Firefox 3 地址栏打入 facebook 就会出现这么个情景:

(delphij 的意见:事实上邮件标题不应该带有隐私内容,因为即使邮件加密,邮件标题也是明文的,所以这个问题也可以怪罪到 facebook 头上)有人怒道:
I’m using Firefox 3.0.1
When I logout from Gmail, if I type gmail on the address bar it will show the topic of the mails in the dropdown menu.
Where is my privacy? Where is the privacy of my friends using my computer to access their gmail account?
That smart bar is awful, by the way.
Considering going back to the older version of FF.
其实这个问题以前就存在,打开历史记录就全看到了,只不过历史记录很少有人无聊去翻,而最近有一些浏览器比如 Firefox 3 和 Google Chrome 大举将地址栏改造成了历史记录检阅簿,导致这个问题直接暴露在人民大众面前。下面再举例一些数字时代容易留下痕迹(甚至不可能不留痕迹)的地方:
- 浏览器表单、cookie、history、cache。
- 聊天记录有不少默认开启,特别 gtalk 默认就在服务器上记录。
- 电脑中的 Recent files,使用程序在文件系统和注册表里留下的记录(您的视频播放器里的最近播放列表是不是一堆毛片呢?)
- email 收件人一般都可以在 email header 里查到发件人的 IP
- 浏览过别人的网站在他们服务器上留下的记录
- 蓝牙和别的无线设备所到之处会留下痕迹
- whois 可以查到大多数域名注册者的详细地址和电话
- social networking 网站稍加挖掘就可以找到很多私人资料
- router 含有 NAT 表,可以查到网内的人都在连什么样的网站之类的
- router 的 DHCP 表含有最近附近使用过的(无线和有线)设备的 mac 地址(进而可以知道设备厂家和型号)
- GPS 设备内部可能带有 track log
- 身份证号常随获奖名单之类的公布,搜索人名有时候可以查到身份证号(进而知道生日、籍贯等)
- 手机的电话记录和账单记录
- 电话重拨功能记录了前一次或前几次的电话号码,即使没有数字显示也很容易从双音频拨号声分析出来
- 银行账单有详细的明细表,比如取钱的具体时间和地点
- 如果交通违规,违规单上会有详细时间和地点
- 新闻报道难以控制,人怕出名猪怕壮
很多时候,在隐私性和方便性之间的平衡点往往因人而异,于是像 facebook 之类的网站都要搞一大堆很细节的隐私选项。Gmail 在打开信件之后为什么要在浏览器标题条显示 email 地址和信件标题呢?这个看似挺人性化的功能其实并不一定那么有用(然后还关不掉?)。不过就事论事,浏览器历史记录里存了这些个信件标题,看起来倒更像是浏览器的责任,因为那些个请求都是明确说了 no-cache 的(虽然这并不指示不要加入 history,但是不加入更合理一些)。
话说回来,浏览器里不留痕迹是很难的。可以用 Portable Firefox、Safari 的 Private Browsing 或者 Google Chrome 的 Incognito mode 之类的。这种“Porn Mode”(也有人叫 Banking Mode),似乎 Firefox 3.1 和 IE8 也做进去了。
单位是什么
August 21, 2008 11:06 am UTC | In Study | 7 Comments | hide单位是日常生活中不可或缺的要素,当我们谈论一个实际生活中的数字的时候,一般这个数字后面都是跟了一个单位的。今天气温 30 度,高速公路限速 100 公里/小时,如果科学家没有把单位定义好,那么人和人就难以交流了,秦始皇统一度量衡很伟大。
单位归根结底是一种比较。我们说一根木头长 2 米,意思是说这根木头和长度单位“米”相比较有两倍长,“2 米”的意义,实际上是说,2 乘以 长度单位米。在这个观念的指导下,单位换算也会有比较好的理解。比方火车速度 100 米/秒,换算成 公里/小时 应该是多少?有人可能记得换算关系是 1:3.6,那么到底是乘以 3.6 还是除以 3.6?我一般是用这种土鳖的办法:
首先写下基本单位的换算关系:
1000 米 = 1 公里,3600 秒 = 1 小时
所以说:
1000 米 / 1 公里 = 1(纯数,没有单位),3600 秒 / 1 小时 = 1。
任何一个东西乘以纯数 1 都是不变的,所以:
100 米/秒
= 100 米/秒 x(1 公里 / 1000 米)x(3600 秒 / 1 小时)
= 100 / 1000 x 3600 x (米/秒 x 公里/米 x 秒/小时)
= 360 公里/小时
这里计算的时候注意单位和数字是分别计算和约去的。土人我多年来都用这种办法换算,不容易出错。
单位是一套很有用的工具,量纲分析用来避免错误是很常见的。一个简单的问题:一小时 CD 音质的音乐有多少数据量?带单位的计算如下:
(16 bits/sample) x (44100 samples/second/channel) x (2 channels) x (3600 seconds / hour)
x (1 byte / 8 bits) x (1 MiB / (1024×1024 bytes)) = 605.6 MiB/hour.
(这个问题如果不带单位直接算数字:16×44100x2×3600/8/1024/1024,很容易搞晕掉)
delphij 说,一篇 Blog 不要写太长,Draft 也不要搁太久,写了啥就先发表出来。基于这个理念,我就先把上面这部分发表了吧,有空接着写 单位是什么(续)。
导航技术
June 10, 2008 7:28 pm UTC | In Study | 13 Comments | hideA. GPS
某日 delphij 同学来访,到我楼下给我打电话是这么说的:“我现在 GPS 显示的坐标是北纬 37 度 25 分 33 秒,西经 122 度 9 分 25 秒,我不确定是不是就是这个楼?”我只好立刻在 Google Map 输入经纬度,心里默念这是不是太军事化了……
全球定位系统(GPS),一个耳熟能详的名字,我以前几篇土文曾提到过一些。GPS 卫星网目前有超过 30 颗在工作,在地球上大部分地区大部分时间可以同时看到至少 8 颗卫星,其中 45 度仰角之上至少 4 颗。能看到 4 颗卫星就够定位用了,所以即使在高楼耸立的大城市里,GPS 定位还是十分有效的。现代 GPS 芯片可以同时处理 12 颗 GPS 卫星的信号以提高精度,一般在空旷地带可以达到 10 米以下的水平定位精度。
GPS 的民用卫星信号曾经人为的加入高达 100 米的误差(所谓的 Selective Availability,简称 SA),后来由于种种原因终于在 2000 年 5 月被关掉,将来的卫星也将不再包含 SA 功能,所以相信 SA 已经永远消失了。也正是在 SA 被关闭之后,GPS 的民用价值才大大的被发挥出来了。有人评论美国国防部干过的最有用的两件事情之一就是架构这个 GPS 了。不过假如美国哪天不高兴了把它关掉,那么全世界的 GPS 接收器就都完完了。为此,欧盟、俄罗斯、印度、日本都有卫星定位系统的项目,中国的北斗似乎也开始工作了,不过这些个系统要达到 GPS 的规模都还需要很多年的时间。
GPS 的定位误差来源于很多方面,比较大的有电离层干扰、原子钟和卫星轨道误差等。大部分大的误差项在空间和时间上的变化都是缓慢的,在某个时间段某个大城市里所有的 GPS 接收器都有几乎相同的误差,这就为进一步修正 GPS 误差提供了可能性。
B. DGPS
接上面一段,如果某个大城市里有一个固定不动的 GPS 接收站事先知道自己的精确坐标,那么它接收 GPS 信号之后就可以判断出 GPS 信号的误差;如果它再把这些误差信息广播给这个城市里所有的 GPS 接收器,那么大家就都可以修正自己的坐标得到很精确的定位了。这个就是差分 GPS(Differential GPS,DGPS)的基本思想。
要发挥出 DGPS 的潜能,需要大批地面基站网,这个有不少国家都做了,甚至自己也可以建。如果和基站距离很近,厘米级的定位是可以达到的,Precision Farming 就是农民应用现代 DGPS 技术的一个例子,也有人用 DGPS 来让轮船精确靠岸等等,不过大部分大型 DGPS 系统都要交点钱才能用(解码误差信号),在美国很受欢迎的 WAAS 系统,使用则不需要缴年费。
WAAS 最早开发出来是用来在美国境内精确导航飞机的。WAAS 在地面有几十个基站,各个基站的误差数据汇总后发给两颗同步卫星(间隔 26 度经线,固定在美洲大陆赤道上空),再由这两颗卫星转发给地面的 WAAS-enabled GPS 接收器。这类接收器现在市面上很多,如果在美国用就能(在屏幕上)看到南方大概 45 度仰角的地方两颗固定不动的卫星(编号 48、51),只要接收到其中一颗的信号,那么定位精度就可以到 5 米以下,最好的地方可能能到 1 米左右。
很多带 GPS 的手机现在都开始用 A-GPS(Assisted GPS)技术了,用手机基站的 GPS 信号来辅助定位,不但可以在 GPS 信号很差的情况下定位,同时手机基站也可以作为 DGPS 基站提供差分误差数据以提高定位精度。
C. INS
我们平时坐车都会感受到惯性力,车加速的时候人会往后靠,车拐弯的时候人会往侧面倾斜。想象把人用上下左右前后六个弹簧秤吊在车里,那么就可以把三个方向的惯性力也就是加速度测量出来,加速度累加可以得到速度,速度再累加一次就可以得到位置,这样就可以导航了(准确的说,是把加速度积分两次得到位置,需要预先知道初始速度和初始位置)。这种导航机制叫做 INS,全称 Inertial Navigation System 惯性导航系统,本质上和 GPS 完全不同。
光测量三个方向的加速度是不够的。想象有一架飞机在往北飞,飞机上的加速度仪感受到了一个向东的力,这可能是因为飞机在往西转弯(转动产生的离心力),也可能是因为突然吹来一阵东风但飞机仍在往正北飞行,如果不能区分这两种情况,那么机头朝向就会算偏掉。因此,真正能用的 INS,还需要一个精度很高的定向仪,一般叫做陀螺仪(gyroscope),最简单的做法就是在飞机里放一个高速旋转的陀螺,在比较理想的情况下,陀螺的指向基本不随飞机转动而变化(物理学里这个叫做角动量守恒),这样就可以定向了。
总结起来,加速度仪 + 陀螺仪 + 强大的计算机就可以制作 INS 了。实用的 INS 需要考虑经纬度、地球自转、科里奥利力等,需要做大量的转动坐标系变换,还需要事先知道各地引力的变化。爱因斯坦说,引力和加速度是等效的,所以假如飞机经过一个事先不知道的金矿时引力变大,那么 INS 测到额外的加速度就会误以为飞机开始上升了。INS 还有一个致命的问题是累积误差会越来越大。单是电子设备的噪声,如果不加修正,经过一段时间的两轮累加就会产生巨大的误差。在 GPS 建成之前,人们花了很多功夫在 INS 上面,尽管 INS 早已实用,但是仍旧太复杂,造价太高,大概只有军用、航天和大型客机之类的地方才用得起。当初,如果 INS 和小型计算机没有及时的被发明出来,阿波罗登月那是不可能的(肯尼迪当年就是如此牛逼的预计到了各类技术都快成熟了)。
D. GPS + INS
GPS 和 INS 的关系非常互补,表现在一个的缺点往往是另一个的优点。INS 长期工作出现的累积误差可以被拥有外部参照系的 GPS 及时修正;而正因为 INS 不需要外部参照,在 GPS 失效的情况下(隧道、海底、敌人干扰等),INS 可以暂时接替导航工作直到 GPS 信号恢复;另外 INS 的数据输出很快,即使 GPS 信号良好,INS 也可以辅助提供更精确的定位信息。如果再加上 DGPS,DGPS + INS 的组合基本就是无敌的了,不过飞机起降还有本地雷达无线电导航,据说最帅的自动降落系统因为实在太精确了,不得不人为加入随机误差以免太多飞机在同一个地方触地把跑道砸坏。
This weblog is licensed under a Creative Commons License.
Powered by WordPress. Theme based on Pool by Borja Fernandez.







