数学是定量工具, 是对一个已经初步成型的概念车进行精细化.
但概念车是怎么从无到有产生的? 这就要靠不是十分有把握, 十分有理性的尝试性的 猜想 (hypothesis), 类比 (analog).
比如我是怎么想到在一篇中文文章里可以找一两个单词在它们后面加括号注上对应英文的? 那天半夜里我一个人在对着某个 oi 前辈 sunzx 的 gtalk 自言自语. 如下. 试问, 在这个源头创新的思路过程中, 我哪里用到量化的数学方法了? 我完全是在尝试性的做哲学高度的琢磨. 源头创新就是从没有把握的尝试性思索到有把握的理性检验的一个混沌到清晰的过程.
4/29/2007 2:1505 AM chatlog:
(2:15:17 AM) Ziyuan Yao: 英语最主要的问题还是词汇量
(2:15:30 AM) Ziyuan Yao: 这是中国人用英语难的关键问题
(2:15:39 AM) Ziyuan Yao: 也是英语和编程语言的区别
(2:15:53 AM) Ziyuan Yao: 编程语言规则有限,词汇量每次只要针对一个 SDK
(2:16:05 AM) Ziyuan Yao: 不搞百团大战
(2:24:42 AM) Ziyuan Yao: 我有 basic english 解释 english words 的对照表
(2:30:59 AM) Ziyuan Yao: 领域词汇确实可以像编程一样即学即用
(2:31:10 AM) Ziyuan Yao: 但通用词汇怎么用 basic english 转写呢
(2:31:24 AM) Ziyuan Yao: 人们不习惯间接转写
(2:31:30 AM) Ziyuan Yao: 还是查字典快些。。
(2:33:05 AM) Ziyuan Yao: 但查了字典会忘
(2:33:18 AM) Ziyuan Yao: 忘了再查 :)
(2:33:58 AM) Ziyuan Yao: 恩纳,我只保证可靠性,不保证熟练性
(2:34:30 AM) Ziyuan Yao: 就应该像学汉字一样,
(2:34:42 AM) Ziyuan Yao: 通过泛读
(2:34:53 AM) Ziyuan Yao: 而不是有计划的背诵
(2:40:46 AM) zongxiao@gmail.com is no longer away.
(2:50:56 AM) zongxiao@gmail.com has gone away.
(2:52:17 AM) Ziyuan Yao: 目前我认为最自然的外语单词学习法是
(2:52:20 AM) Ziyuan Yao: 用一个浏览器插件
(2:52:32 AM) Ziyuan Yao: 在用户阅读母语网页时
(2:52:48 AM) Ziyuan Yao: 对某些或全部单词加注外语对应单词
(3:01:55 AM) zongxiao@gmail.com is no longer away.
(3:03:42 AM) Ziyuan Yao: 人脑是相当迟钝的。。
(3:03:48 AM) Ziyuan Yao: 不适合创新。。
(3:07:23 AM) zongxiao@gmail.com has gone away.
(3:08:36 AM) zongxiao@gmail.com is no longer away.
(3:18:31 AM) zongxiao@gmail.com has gone away.
大家注意到当我说到 2:34:53 AM 以后, 我已经意识到学英语生词应该像学汉字生字一样 ---- 在阅读绝大多数都是已知汉字的少儿读物时, 遇到一两个生字, 而少儿读物常常对这些生字加注拼音 ---- 这个显然可以类比到学习英语生词, 也就是在阅读绝大多数都是已知单词 (母语单词!) 的读物时, (故意!) 出现一两个英语生词! 于是我赶紧去 list.linguist (一个 USENET 新闻组, Google 提供永久存档的) 用英语记下这个令人振奋的 idea, 然后 2:52:17 AM 我跑回来跟 sunzx 讲这个 idea.
而且 3:03:42 AM 我还感慨的说了句, 意思是 这种伟大的点子本应该可以让计算机通过 prolog 式的形式推理自动推理出来的, 人脑能想到完全是因为人脑正好作出了一个恰当的类比.
至于数学要什么时候才用到? 是对这个 main idea 具体化的时候, 比如在用户当前面对的中文网页进行这种故意加注英文的处理时, 我们选择哪些中文单词进行英文加注? 显然一个思路是选那些重复出现次数最多的, 其次是选那些 未来期望重复出现次数最多的 (比如如果这不是一个静态的中文网页而是一个进行中的中文聊天). 这个未来期望怎么算, 这才要用到数学, 但也不光是数学, 因为还有很多数学以外的因素也是可以加进去的, 比如当一个单词出现在一个提问中, 那么将来的回答中就可能又提到这个单词.