对于什么是“焦头烂额”终于有了切身的体会,就在最近这两个多星期里。以前曾经有段时间经常抱怨说自己很忙,但是和最近这段日子相比,感觉还是小巫见大巫了。
大老板和深圳那边成立了一个联合研究中心,对于资金投入和转拨的问题需要进行协调。第一次真正认识到两边的巨大的差异,香港这边真真正正的是按照法律、按照制度来办事,虽然开始的时候也许会有不少手续上的麻烦,但是以后执行起来有章可循、会容易很多;而深圳那边却是多了不少人治的成份,对于资金的使用基本上是教授(老板)自己说了算,制度成了摆设,因此需要费心不少。两边的差异也让人感觉多少有些悲哀,虽说内地叫了多年的“依法治国”,可是法制甚至制度的建设还是落后一大截。
因为研究中心的缘故,和大老板一起在深圳那边带了几个学生一起做项目,因此多了不少琐碎的事情:一会儿是要布置工作,一会儿要督促工作进度,一会儿要答疑解惑;当然,少不了的是需要经常花上2、3个小时跑去深圳那边:九广铁路+罗湖过关+深圳地铁+公交。一个字:累啊。
希望事情的头绪慢慢清晰起来,让这焦头烂额的日子早点过去吧。
Thursday, March 22, 2007
Friday, March 16, 2007
可亲可敬的温总理
一年一度的两会结束了,其实对于两会,最期待的还是总理的记者招待会(看全文实录)。今天的招待会,从一开始就让人领路到温家宝总理的可亲可敬,不愧为人民的好总理,人民的公仆。看看他的开场白吧,怎么可能不令人感动呢?
|
Thursday, March 15, 2007
新本本到手X60+Vista
自己有个缺点,就是喜欢隔三差五就换个本本、尝尝新鲜,即时手上的本本已经令一些人羡慕很久的了。
前一段时间,在自己不断劝告自己的情况下,换本本的欲望已经沉寂了很久。可是这个欲望在那次组会之后又被再次“撩拨”了起来。同事要新买一台本本,于是也同时也“蛊惑”我一起买。经过一段时间(我发誓,要超过半天的时间!)的摇摆之后,我最终还是禁不住诱惑,同时下了订单。X60 Cor2Duo T5500, 2GRAM, 120G HD,够气派了吧! :)
今天新本本终于拿到手了,手感还不错;第一印象比较深的几点是,第一电源适配器的插头变成灰白色的了,也粗了很多;第二“Lenovo”的标签堂而皇之地出现在了屏幕的左下角;第三是Thinkpad的触摸板的按键没有红色和绿色的条纹了,感觉比X4呆板了不少。
对于Vista,唯一的第一影响是,蛮漂亮的。只可惜对Vista还不习惯,有很多功能还不熟悉。另外,虽然配置已经足够强了,可惜Vista运行起来感觉还是有点慢!可能是Thinkpad预装的东西太多了吧,看了看启动后占用的内存就达到800M了!My God,如果是原配的512M内存还怎么用!Thinkpad就是有这点不好,乱七八糟的一大堆东西统统往上堆砌,叫人无所适从。
前一段时间,在自己不断劝告自己的情况下,换本本的欲望已经沉寂了很久。可是这个欲望在那次组会之后又被再次“撩拨”了起来。同事要新买一台本本,于是也同时也“蛊惑”我一起买。经过一段时间(我发誓,要超过半天的时间!)的摇摆之后,我最终还是禁不住诱惑,同时下了订单。X60 Cor2Duo T5500, 2GRAM, 120G HD,够气派了吧! :)
今天新本本终于拿到手了,手感还不错;第一印象比较深的几点是,第一电源适配器的插头变成灰白色的了,也粗了很多;第二“Lenovo”的标签堂而皇之地出现在了屏幕的左下角;第三是Thinkpad的触摸板的按键没有红色和绿色的条纹了,感觉比X4呆板了不少。
对于Vista,唯一的第一影响是,蛮漂亮的。只可惜对Vista还不习惯,有很多功能还不熟悉。另外,虽然配置已经足够强了,可惜Vista运行起来感觉还是有点慢!可能是Thinkpad预装的东西太多了吧,看了看启动后占用的内存就达到800M了!My God,如果是原配的512M内存还怎么用!Thinkpad就是有这点不好,乱七八糟的一大堆东西统统往上堆砌,叫人无所适从。
Tuesday, March 13, 2007
Google网站导航的问题
Google中国正式推出了“网站导航”(看黑板报这里),按照Google自己官方的说法是为了满足那些“鼠标(搜索)用户”的需求,只要简单点击几下就可以找到需要的目标网站。
且不说“网站导航”的意义如何,不过从发布的页面来说,还有一些问题。事实上,这些问题在前几天被“网友”泄密预览的时候就存在了,只是当时还没有正式发布,以为Google还在改进中,所以就没有理会。不过现在正式发布的版本中问题依然存在,就有必要让Google知道了。
(1)最主要的问题就是“浏览器兼容性”的问题。从发布的“网站导航”的页面来说,最大的一个特点就是增加了不同板块“上移/下移”的功能。不过这些功能在我的“傲游(Maxthon)”上经常出现问题。主要表现在点击“上移/下移”的功能后,就提示javascript运行错误,而显示不出来相应的移动以后的板块了;只有在手动刷新(refresh)以后才能恢复。(我试了直接使用IE6.0和Firefox却没有发现问题。)建议开发人员在Maxthon上调试一下。


(2)第二个是我自己的一个疑问,这个不同板块“上移/下移”的功能是做什么用的?用来个性化定制?那么可以在本机浏览器里保存我的设定么?按照现在的页面效果来看,似乎是不能在本地保存设定的;因为我每次重新手动刷新的时候,就又恢复Google最原始的默认设置了。
且不说“网站导航”的意义如何,不过从发布的页面来说,还有一些问题。事实上,这些问题在前几天被“网友”泄密预览的时候就存在了,只是当时还没有正式发布,以为Google还在改进中,所以就没有理会。不过现在正式发布的版本中问题依然存在,就有必要让Google知道了。
(1)最主要的问题就是“浏览器兼容性”的问题。从发布的“网站导航”的页面来说,最大的一个特点就是增加了不同板块“上移/下移”的功能。不过这些功能在我的“傲游(Maxthon)”上经常出现问题。主要表现在点击“上移/下移”的功能后,就提示javascript运行错误,而显示不出来相应的移动以后的板块了;只有在手动刷新(refresh)以后才能恢复。(我试了直接使用IE6.0和Firefox却没有发现问题。)建议开发人员在Maxthon上调试一下。


(2)第二个是我自己的一个疑问,这个不同板块“上移/下移”的功能是做什么用的?用来个性化定制?那么可以在本机浏览器里保存我的设定么?按照现在的页面效果来看,似乎是不能在本地保存设定的;因为我每次重新手动刷新的时候,就又恢复Google最原始的默认设置了。
Thursday, March 08, 2007
Gmail和Google Calendar进一步整合:Create Event from Email
今天打开一封email想对其进行进一步操作的时候,发现“More actions...”选项里面除了普通的诸如“标记星号/Add start”之外,又静悄悄多了一个“创建事件/Create Event”的选项。
“事件”是Google Calendar里面的主要组成部分。这个功能应该是Google又进一步把Gmail和Google Calendar进行了整合,支持直接由当前的email创建特定的Google Calendar事件了。
试用了一下“Create Event”的功能,感觉还是蛮不错的。 它会自动分析当前的email,并在弹出的Create Event窗口中自动填充相应的资料。有了这个整合的功能,确实方便不少,可以在看email时一键操作而不用再另外去打开Calendar输入重复的资料了。
比如,我试了一下系里发的seminar通知的email,其中包括了Title/Date/Time等信息。在Create Event的时候,这些关键词的信息都被自动提取了出来,并做了相应的格式转换。如图所示。
“事件”是Google Calendar里面的主要组成部分。这个功能应该是Google又进一步把Gmail和Google Calendar进行了整合,支持直接由当前的email创建特定的Google Calendar事件了。
试用了一下“Create Event”的功能,感觉还是蛮不错的。 它会自动分析当前的email,并在弹出的Create Event窗口中自动填充相应的资料。有了这个整合的功能,确实方便不少,可以在看email时一键操作而不用再另外去打开Calendar输入重复的资料了。
比如,我试了一下系里发的seminar通知的email,其中包括了Title/Date/Time等信息。在Create Event的时候,这些关键词的信息都被自动提取了出来,并做了相应的格式转换。如图所示。


Saturday, March 03, 2007
Google黑板报的“Google一下本站”问题多多
闲来无事看Google黑板报,想翻阅以前的存档看看。
(1)自然而然地翻到页面底部,想前后翻页,结果竟然没有这个功能。
(2)也罢,那就使用右侧的“查看存档文章”的功能吧。不过发现,想找某个特定的文章实在不方便。比如想找那篇介绍Google.cn推出全国各个大中城市的地图的文章,就很困难,因为不知道那期文章具体是什么时候的了。
(3)自然而然地想到搜索,Google擅长的不就是搜索么。
于是使用黑板报右上角的“Google一下本站”的功能。先不说把“Google”作为动词使用是否符合Google总部的要求。不过最大的问题是,竟然发现根本找不到相关的资料?岂不怪哉!最擅长搜索的Google,竟然找不到自己的黑板报上的资料。
仔细看了看,原来黑板报把“Google一下本站”链接中的本站的链接(sitesearch)指向了英文Official Google Blog的地址"googleblog.blogspot.com"。试着将这个地址改成了“googlechinablog.com”就可了,比如搜索“地图”,第二条就是我要找的文章了。
可想而知Google中国的“敬业精神”了!直接把总部Google Blog的东西拿过来就用,也不好好检查一下。也许他们自己有自己内部的搜索来找黑板报上的内容,而根本就不用在黑板报上搜索本站吧。
希望尽快改过来才是。
(1)自然而然地翻到页面底部,想前后翻页,结果竟然没有这个功能。
(2)也罢,那就使用右侧的“查看存档文章”的功能吧。不过发现,想找某个特定的文章实在不方便。比如想找那篇介绍Google.cn推出全国各个大中城市的地图的文章,就很困难,因为不知道那期文章具体是什么时候的了。
(3)自然而然地想到搜索,Google擅长的不就是搜索么。
于是使用黑板报右上角的“Google一下本站”的功能。先不说把“Google”作为动词使用是否符合Google总部的要求。不过最大的问题是,竟然发现根本找不到相关的资料?岂不怪哉!最擅长搜索的Google,竟然找不到自己的黑板报上的资料。
仔细看了看,原来黑板报把“Google一下本站”链接中的本站的链接(sitesearch)指向了英文Official Google Blog的地址"googleblog.blogspot.com"。试着将这个地址改成了“googlechinablog.com”就可了,比如搜索“地图”,第二条就是我要找的文章了。
可想而知Google中国的“敬业精神”了!直接把总部Google Blog的东西拿过来就用,也不好好检查一下。也许他们自己有自己内部的搜索来找黑板报上的内容,而根本就不用在黑板报上搜索本站吧。
希望尽快改过来才是。
期待更好的Google翻译质量
看Google黑板报,Google关于中文部分最近做了不少的更新,也推出了不少新的产品。算是可喜可贺的。
比如,关于Google翻译,最近就推出了用户反馈的机制(看黑板报这里)。如果用户在使用Google翻译的过程中,发现结果不尽如人意,就可以向Google提供更好的翻译。正如黑板报自己所说的,“众人拾材火焰高”,充分调动用户的积极性。用户的资源是取之不尽、用之不竭的嘛。
增加用户反馈机制当然对于Google翻译质量的提高有好处。但是我想,如果Google不从技术上,特别是自然语言“理解”的技术上,加大储备,翻译质量还是很难有质的提高的,甚至还是会出现很多不可思议的看似随机的翻译结果出来。
以前写过一篇关于Google翻译和Yahoo翻译的比较的东西。从Google的角度来看问题,她最擅长的就是搜索,在搜索的过程中积累了大量的数据,比如关于同一内容的中文和英文的版本,因此理所当然地采用了“统计学习”的方法来进行自然语言的“理解”和翻译。好处是可以充分利用 google 的大规模数据的资源,但是缺点也是显而易见的,太过于粗糙了,更没有考虑到词汇之间的关系,比如利用 Grammar Rules 来分析句子的语法和结构等等。
所以,我在上面的自然语言理解的“理解”上多加了一个引号来加以强调。对于机器翻译而言,当然首先需要理解原始语言的单词、句子、甚至语段、篇章的含义,得到内部的表示,然后再去转换成目标语言。这里面“理解含义”这一步,对于整个翻译质量来说,是至关重要的。
对于Google翻译而言,她对于原始语句到底“理解”了多少,显然是很值得怀疑的。
大规模数据的“统计学习”,当然能够取得一定的结果,但是如果能够配合自然语言理解的其他方法,比如语法规则Grammar Rules,“数据+规则”才是王道。
以前的文章:
7/16/2006
搞笑的google翻译
这几天在做关于自然语言理解和产生的一些事情,什么基于统计的方法、规则的方法等等搞得有些头大。
今天无聊之中,想试试 google翻译 (google translate) 的质量如何,就随便做了些测试,下面是一些结果。可以看出来,google翻译 有些可取的地方,不过总体来说,还是有不少问题。
从测试的结果(特别是最后一个例子)来分析,可以看出 google 采用的是基于“统计学习”的方法来进行自然语言理解和翻译的,好处是可以充分利用 google 的大规模数据的资源,但是缺点也是显而易见的,太过于粗糙了,更没有考虑到词汇之间的关系,比如利用 grammar rules 来分析句子的结构等等。看来 google 还要在 “自然语言理解” 方面储备更多的技术才行。
发现有些可取的地方,比如说下面这句话(由英文翻译为中文):
This translation work is so difficult that I can not understand.
这个翻译工作非常困难,我不明白.
但是如果我吧其中的“work”去掉,翻译的结果却变成了:
This translation is so difficult that I can not understand.
这将是艰难的,我不知道.
不过下面这些结果就有些不知所以、甚至有些搞笑了,比如:
This man kicked the girl whom I loved.
我这个人喜欢踢女孩.
而如果将“whom”改为“who”,结果却又变成了:
This man kicked the girl who I loved.
这位姑娘我喜欢踢.
随便再写个句子,结果为:
this person kicked my loved girl.
我这个人喜欢踢女孩.
把句子中出现的词汇的顺序随便换一换,竟然出现的还是同样的结果!:
this my loved girl person kicked .
我这个人喜欢踢女孩.
作为参考,yahoo新推出的 翻译服务 就似乎采用了一定的 grammar 的东西,所以结果在某些方面要比 google 的好些。
比如,关于Google翻译,最近就推出了用户反馈的机制(看黑板报这里)。如果用户在使用Google翻译的过程中,发现结果不尽如人意,就可以向Google提供更好的翻译。正如黑板报自己所说的,“众人拾材火焰高”,充分调动用户的积极性。用户的资源是取之不尽、用之不竭的嘛。
增加用户反馈机制当然对于Google翻译质量的提高有好处。但是我想,如果Google不从技术上,特别是自然语言“理解”的技术上,加大储备,翻译质量还是很难有质的提高的,甚至还是会出现很多不可思议的看似随机的翻译结果出来。
以前写过一篇关于Google翻译和Yahoo翻译的比较的东西。从Google的角度来看问题,她最擅长的就是搜索,在搜索的过程中积累了大量的数据,比如关于同一内容的中文和英文的版本,因此理所当然地采用了“统计学习”的方法来进行自然语言的“理解”和翻译。好处是可以充分利用 google 的大规模数据的资源,但是缺点也是显而易见的,太过于粗糙了,更没有考虑到词汇之间的关系,比如利用 Grammar Rules 来分析句子的语法和结构等等。
所以,我在上面的自然语言理解的“理解”上多加了一个引号来加以强调。对于机器翻译而言,当然首先需要理解原始语言的单词、句子、甚至语段、篇章的含义,得到内部的表示,然后再去转换成目标语言。这里面“理解含义”这一步,对于整个翻译质量来说,是至关重要的。
对于Google翻译而言,她对于原始语句到底“理解”了多少,显然是很值得怀疑的。
大规模数据的“统计学习”,当然能够取得一定的结果,但是如果能够配合自然语言理解的其他方法,比如语法规则Grammar Rules,“数据+规则”才是王道。
以前的文章:
7/16/2006
搞笑的google翻译
这几天在做关于自然语言理解和产生的一些事情,什么基于统计的方法、规则的方法等等搞得有些头大。
今天无聊之中,想试试 google翻译 (google translate) 的质量如何,就随便做了些测试,下面是一些结果。可以看出来,google翻译 有些可取的地方,不过总体来说,还是有不少问题。
从测试的结果(特别是最后一个例子)来分析,可以看出 google 采用的是基于“统计学习”的方法来进行自然语言理解和翻译的,好处是可以充分利用 google 的大规模数据的资源,但是缺点也是显而易见的,太过于粗糙了,更没有考虑到词汇之间的关系,比如利用 grammar rules 来分析句子的结构等等。看来 google 还要在 “自然语言理解” 方面储备更多的技术才行。
发现有些可取的地方,比如说下面这句话(由英文翻译为中文):
This translation work is so difficult that I can not understand.
这个翻译工作非常困难,我不明白.
但是如果我吧其中的“work”去掉,翻译的结果却变成了:
This translation is so difficult that I can not understand.
这将是艰难的,我不知道.
不过下面这些结果就有些不知所以、甚至有些搞笑了,比如:
This man kicked the girl whom I loved.
我这个人喜欢踢女孩.
而如果将“whom”改为“who”,结果却又变成了:
This man kicked the girl who I loved.
这位姑娘我喜欢踢.
随便再写个句子,结果为:
this person kicked my loved girl.
我这个人喜欢踢女孩.
把句子中出现的词汇的顺序随便换一换,竟然出现的还是同样的结果!:
this my loved girl person kicked .
我这个人喜欢踢女孩.
作为参考,yahoo新推出的 翻译服务 就似乎采用了一定的 grammar 的东西,所以结果在某些方面要比 google 的好些。
Subscribe to:
Posts (Atom)