关于现今科研中的科学计算……

来源:百度文库 编辑:超级军网 时间:2024/04/30 13:03:11
这几天同学聚会,跟一个搞生物正在读博的同学聊天,聊到了当今科研中的科学计算问题。

这年头,搞科研的,尤其搞某些科研的都很爽,因为有计算机了,很多东西方便了,程序写好,参数设置好,算算就有结果了。很多时候,有些科研逐渐成为一种IT民工的状况,写程序,然后低准度大规模的用类似穷举或者比穷举好不了多少的方法铺天盖地算,找出适合的参数区间或者方法,然后再提高精度和计算时间,然后精确的深入计算……比如计算分子折叠,可能他设置了不同的生化参数在不断的试验,有些可怕的生化过程涉及的浓度,含量,参数可能几十个,涉及到计算量和时间早已是天文数字……但是没关系,我们全交给计算机,然后我们喝着咖啡,悠闲的等就可以了……

这是一种对以前的科研方法的一种颠覆,在没有大规模集成电路,超级计算机的年代是无法想象的,更早一点,在牛顿,柯西,拉格朗日那个年代更是没得说,如果有计算机,把结果加起来就好了,可能微积分都不需要了。没有计算机的时候,时间是宝贵的,这种铺天盖地计算是不可能的,于是科学家不得不简化模型,优化算法,甚至只抓重点,只能想办法在理论层面上更进一步,使用更精确和更实际的方法来实验等等,这个过程才是人类能真正认识自然的过程……现在呢,交给计算机吧。解析法见鬼去吧,可能我模型几个月都算不出来一个解;实验见鬼去吧,太麻烦太累人了;反正有计算机,我们只要算就好了,于是你发现,科研人员一旦倚赖上计算机,越来越懒越来越傻……科研在近代的工程化,程序化和循规蹈矩越来越明显,已然成为一种产业模式,科研人员成了工匠,科研过程变成了资本运作过程,谁有钱,就有更好的计算机,更多的计算时间就能获得更多的成果,从而得到更多的经费……

但是我们不要忘记,目前人类最重要的科学发现和科研成果,绝大部分都不是算出来的,而且某些计算结果的真实性也很值得怀疑,因为有误差累积,还有很多模型实际上也是有问题的,更有许多不能进行数值计算的问题,所以这真的是正确的发展方向么??这几天同学聚会,跟一个搞生物正在读博的同学聊天,聊到了当今科研中的科学计算问题。

这年头,搞科研的,尤其搞某些科研的都很爽,因为有计算机了,很多东西方便了,程序写好,参数设置好,算算就有结果了。很多时候,有些科研逐渐成为一种IT民工的状况,写程序,然后低准度大规模的用类似穷举或者比穷举好不了多少的方法铺天盖地算,找出适合的参数区间或者方法,然后再提高精度和计算时间,然后精确的深入计算……比如计算分子折叠,可能他设置了不同的生化参数在不断的试验,有些可怕的生化过程涉及的浓度,含量,参数可能几十个,涉及到计算量和时间早已是天文数字……但是没关系,我们全交给计算机,然后我们喝着咖啡,悠闲的等就可以了……

这是一种对以前的科研方法的一种颠覆,在没有大规模集成电路,超级计算机的年代是无法想象的,更早一点,在牛顿,柯西,拉格朗日那个年代更是没得说,如果有计算机,把结果加起来就好了,可能微积分都不需要了。没有计算机的时候,时间是宝贵的,这种铺天盖地计算是不可能的,于是科学家不得不简化模型,优化算法,甚至只抓重点,只能想办法在理论层面上更进一步,使用更精确和更实际的方法来实验等等,这个过程才是人类能真正认识自然的过程……现在呢,交给计算机吧。解析法见鬼去吧,可能我模型几个月都算不出来一个解;实验见鬼去吧,太麻烦太累人了;反正有计算机,我们只要算就好了,于是你发现,科研人员一旦倚赖上计算机,越来越懒越来越傻……科研在近代的工程化,程序化和循规蹈矩越来越明显,已然成为一种产业模式,科研人员成了工匠,科研过程变成了资本运作过程,谁有钱,就有更好的计算机,更多的计算时间就能获得更多的成果,从而得到更多的经费……

但是我们不要忘记,目前人类最重要的科学发现和科研成果,绝大部分都不是算出来的,而且某些计算结果的真实性也很值得怀疑,因为有误差累积,还有很多模型实际上也是有问题的,更有许多不能进行数值计算的问题,所以这真的是正确的发展方向么??
计算生物学是重要的,因为计算生物学可以通过数据分析提供正确率高,并且可以验证的假设,但计算生物学不是万能的,因为你得出的假设仍然需要实验验证。另外,时效性在生物这个领域很重要,啥热门领域都是一堆牛人在疯抢,第一个发现的发CNS,第二个可能发Blood之类,第三个可能只能去Plos One。
在生物口,没有实验结果做支撑,不但计算结果没意义,连计算本身都无法展开。因为计算机作拟合计算的基础是要有大量的实验结果,用这些结果建模才能去算那些未知的,这个叫做training。
在我接触到的学科范围内,理工科还没有哪一个方向计算机模拟可以取代实验的,和物理模拟一样都是辅助。
fdbiology 发表于 2013-3-8 11:33
在生物口,没有实验结果做支撑,不但计算结果没意义,连计算本身都无法展开。因为计算机作拟合计算的基础是 ...
事实就是专门有做计算,不做实验的lab,什么叫training
MagicRabbit 发表于 2013-3-11 13:02
在我接触到的学科范围内,理工科还没有哪一个方向计算机模拟可以取代实验的,和物理模拟一样都是辅助。
现在设计模拟电路都很少用万能板搭电路了,直接用电脑模拟,效果不错。


lz,计算分子折叠没有什么参数可以选择,这方面的计算并不是穷举法瞎试验。

如果用分子动力学方法,给定一个初始结构和力场,那么计算结果就是确定性的,只不过速度会很慢。因为生物分子很大,典型的例子,你会用掉8G内存,用8核CPU并行,可能一天只能模拟1纳秒。。。所以问题并不在瞎折腾参数

至于楼主幻想的,科研变成IT民工,只要喝咖啡等着就行了,呵呵我也希望是这么简单。计算机只是工具,科研还是科研。我们永远不可能做一个宇宙模拟器,因此简化模型,优化算法什么时候都是必要的。

至于数值计算的问题,早在计算机出现以前就应用了,凡是没有解析解的问题,都只能应用数值计算。比如量子力学对分子结构的解释,除了类氢原子(只有一个原子核一个电子)以外,都没有解析解,难道就不做了不成?

至于科研人员变得越来越懒,笨,至今没有发现这种现象。。。实际上我认识一些专门做分子动力学模拟的,现在花在分析数据的时间,比上机时间还长的多。实际上电子计算机的发展,正是把科研人员从查计算尺的无聊劳动中解放了出来。

综上所述,楼主对科学计算的理解是片面的。楼上两位专业人士,说的大概是生物信息学的计算,楼主的同学和我说的是结构生物学的计算。这两者虽然都算生物,可是原理和方法有很大区别,请围观群众不要混为一谈

lz,计算分子折叠没有什么参数可以选择,这方面的计算并不是穷举法瞎试验。

如果用分子动力学方法,给定一个初始结构和力场,那么计算结果就是确定性的,只不过速度会很慢。因为生物分子很大,典型的例子,你会用掉8G内存,用8核CPU并行,可能一天只能模拟1纳秒。。。所以问题并不在瞎折腾参数

至于楼主幻想的,科研变成IT民工,只要喝咖啡等着就行了,呵呵我也希望是这么简单。计算机只是工具,科研还是科研。我们永远不可能做一个宇宙模拟器,因此简化模型,优化算法什么时候都是必要的。

至于数值计算的问题,早在计算机出现以前就应用了,凡是没有解析解的问题,都只能应用数值计算。比如量子力学对分子结构的解释,除了类氢原子(只有一个原子核一个电子)以外,都没有解析解,难道就不做了不成?

至于科研人员变得越来越懒,笨,至今没有发现这种现象。。。实际上我认识一些专门做分子动力学模拟的,现在花在分析数据的时间,比上机时间还长的多。实际上电子计算机的发展,正是把科研人员从查计算尺的无聊劳动中解放了出来。

综上所述,楼主对科学计算的理解是片面的。楼上两位专业人士,说的大概是生物信息学的计算,楼主的同学和我说的是结构生物学的计算。这两者虽然都算生物,可是原理和方法有很大区别,请围观群众不要混为一谈
做密度泛函的,觉得LZ有些多虑了
至少在DFT的计算里,如果没有实验数据的支撑与比较,那么获得的数据毫无意义
newdc 发表于 2013-3-12 00:48
现在设计模拟电路都很少用万能板搭电路了,直接用电脑模拟,效果不错。
忘了这茬了。。。电子元件的参数已知,模拟和实际结果差不多。不过化学、化工、机械、材料、冶金、生物什么的模拟还是要有实验基础的,否则结果没有意义,因为不知道是否准确。。。
现在老有人说核武器可以不用实验直接计算机模拟,我觉得这就纯属扯淡,没有实验,且不说数学模型是否准确,模拟的初始条件和边界条件怎么来,靠猜吗。。。
现在老有人说核武器可以不用实验直接计算机模拟,我觉得这就纯属扯淡,没有实验,且不说数学模型是否准确, ...
前提是已经通过大量实验得到足以支撑模型的数据。单纯的仿真没有任何意义。
你错了,科学计算本身就是一门严谨的学科。因为计算机的性能总是有限的,所以要研究算法之类。
agein 发表于 2013-3-12 12:48
前提是已经通过大量实验得到足以支撑模型的数据。单纯的仿真没有任何意义。
对的,我说的就是这个意思。。。
反正在我的研究领域,计算机只能仿真,就是只能验证方法大概可行不,然后还要证明收敛,consensus,收敛速度等等之类的,这不是计算机能证明的
明镜亦无台 发表于 2013-3-8 11:19
计算生物学是重要的,因为计算生物学可以通过数据分析提供正确率高,并且可以验证的假设,但计算生物学不是 ...
一切科学都是实验,计算只是辅助
计算能解决很多问题。但是更多的问题是计算所解决不了的。
能用计算来解决的问题都是领域内主要关系与机制搞清楚,且计算量又不太大的。而计算出来的东西,一般还需要实验检验的。