郝柏林 复旦大学理论生命科学研究中心 中国科学院理论物理研究所

Slides:



Advertisements
Verwante presentaties
Het verhaal van de Chinese sterrenbeelden 十二生肖 Shíèr shéngxiào
Advertisements

中文 考试 Zhōngwén kǎoshì Chinees examen.
CHECK-IT 中荷信息技术知能中心 China-Holland Educational Competence and Knowledge Center on Information Technology.
China Project 2012 Elektromechanica Infosessie 1.
  Pangu 盘古  Natuur.
亞姆斯特丹華人宣道會亞姆斯特丹華人宣道會亞姆斯特丹華人宣道會亞姆斯特丹華人宣道會 歡迎您參加本教會崇拜歡迎您參加本教會崇拜歡迎您參加本教會崇拜歡迎您參加本教會崇拜 Chinese CAMA Gemeente heet u welkom!
日本語入力方法 Input van het Japans
Zoeken naar Rho's Jullie hebben met BLAST gezocht naar Rho in planten...  En die hebben jullie gevonden, maar... Lijken ze meer op Rac, Rho of Cdc42?
RWW unit 6 Passive-de lijdende vorm Vergelijk deze zinnen:
Construerende Technische Wetenschappen Vakgroep Technische Stromingsleer Stage bij ISAS/JAXA (okt.-dec. 2007) Roel Müller.
Het einde van 2000 jaar geschiedenis
中国 ASIANPROJECT EA Yan Hua Alex Vanhaesendonck Jan Van der Velpen Eddy Schoeters.
Deltion College Engels C1 Gesprekken voeren [Edu/004]/ thema: There are lies, damned lies and statistics... can-do : kan complexe informatie en adviezen.
形容詞 + 名詞 bijvoeglijknaamwoord+n adjective+nom 豪華 Háohuá Luxe 快速 Kuàisù Snel 破舊不堪 Pòjiù bùkān vervallen 汽車 摩托車 腳踏車.
奈良時代 De Nara-Periode Door Jinte, Sara, Aya en Mick.
Chinees liefde en huwelijk
Studeren in China “Het China-semester 中国学期 ”. Waarom een ‘China-semester’? Europese tendens tot integratie ‘China- semester’ in opleiding Chinees, talenkennis,
Steven Hagers Cultuurles op 6 oktober  Kanji  Hiragana  Katakana De combinatie van deze schriften heet: kanji-kana-majiribun 母がいつも自転車でデパートに行きます。
Deltion College Engels B2 Spreken/presentaties/subvaardigheid lezen [Edu/003] thema: Holland – coffee shops and euthanasia? can-do : kan een duidelijk.
‘WAIT FOR ME’ Lees met elkaar de songtekst Klik door naar volgende scherm.
Deltion College Engels B2 Gesprekken voeren [Edu/005]/subvaardigheid luisteren thema: ‘Pink pop and air-controllers on strike’ can-do : kan in een telefoongesprek.
Deltion College Engels B1 En Spreken/Presentaties [Edu/006] Thema: “The radio station“ can-do : kan een publiek toespreken, kan verzonnen gebeurtenissen.
Deltion College Engels C1 Schrijven [Edu/007] thema: Mind twister or how to write an essay… can-do : kan heldere, goed gestructureerde uiteenzetting schrijven.
Deltion College Engels B2 Lezen [Edu/003] thema: Topical News Lessons: The Onestop Magazine can-do: kan artikelen en rapporten begrijpen die gaan over.
Deltion College Engels B2 Spreken [Edu/001] thema: What’s in the news? can-do : kan verslag doen van een gebeurtenis en daarbij meningen met argumenten.
Thursday, 02 April 2015 donderdag 2 april 2015 The Song of the Rain 4’51’’ Dans La Nuit 3’52’’ If You Go Away 3’52’’ RADIO JEFKEN 84 STOP CLICK = START.
Deltion College Engels B1 Spreken [Edu/001] thema: song texts can-do : kan een onderwerp dat mij interesseert op een redelijk vlotte manier beschrijven.
Test Tender module Stap 1 Klik op het gewenste object.
Japans – Les 2 – 2014/09/16. Aanwezigheden! Is iedereen die hier zit ingeschreven?
Deltion College Engels B2 Schrijven [Edu/002] thema: how we celebrate birthdays can-do : kan een samenhangend verhaal schrijven.
Monday, 20 April 2015 maandag 20 april 2015 Click Klik.
セルオートマトン 2011/4/25.
人力资源开发与管理 洪颖
人力资源开发与管理 洪颖
電子線照射用試料 (β-LiAl) の 育成とその電気的特性の測定 矢萩・橋本研究室 工 E11002 阿部 信介
第三章 商業自動化 第二篇 企業對企業 B2B 篇. 2015/6/13 第三章 商業自動化 2 大綱  商業自動化之意義  商業自動化與電子商務之關係  商業自動化之四大內容  商品條碼  RFID 無線晶片條碼  銷售點管理系統 POS  電子資料交換 EDI  加值網路 VAN.
微生物應用工業微生物應用工業 阮雪芬 Sep 9, 2002 NTUT. 緒論 微生物應用工業 ? 微生物 ? 微生物學 ?
主講:黃秀政 國立中興大學歷史學系教授 時間:98年7月14日(星期二)下午 地點:歷史系605室
发酵食品工艺学 ——主讲:陈晓红.
蘇雅蕙 國立中正大學心理學系 國科會千里馬計畫 蘇雅蕙 國立中正大學心理學系
© 2011 台灣培生教育出版(Pearson Education Taiwan)
数理科学与生命科学 郝柏林 复旦大学理论生命科学研究中心 中国科学院理论物理研究所
荷 蘭 H o l l a n d 班級:觀二一 姓名:李琬慈 座號: 5 號. 荷蘭正式的國名 Koninkrijk der Nederlanden Koninkrijk der Nederlanden Kingdom of Netherlands 低地的意思.
Copyright met toestemming gebruikt van Stichting Licentie © 1999 Joel Houston/Hillsong Publishing 1/6 EVERYDAY (Joel Houston) 1. What to say Lord it's.
Deltion College Engels B2 (telefoon)gesprekken voeren[Edu/002] /subvaardigheid lezen/schrijven thema: I am so sorry for you… can-do : kan medeleven betuigen.
Kom, ga met ons mee Come, go with us. ‘Wij vertrekken nu naar het land dat de Heer ons beloofd heeft. Ga met ons mee! Je zult het goed hebben bij ons.
Time management Howdoyouset priorities?. Priorities:thingsthatyouthinkare important.
现代立体形态设计 (立体构成) 立体形态概论 1. 立体形态的造型要素 2. 立体形态的材料要素 3. 立体形态的造型形式和方法 4. 立体形态的美学要素 5. 立体形态在设计实践中的应用首页现代立体形态设计.
RFID 概論 建國科技大學資管系 饒瑞佶 2010
…Fotografie … *** Mija … *** …Fotografie … *** Mija … *** Muziek…Dana Winner… PowerPoint voorstelling loopt vanzelf. Muziek…Dana Winner… PowerPoint voorstelling.
Dr. Heidi Hoeben Dr. Ilse Muyshondt Kiezen voor low cost dialyse: peritoneale dialyse, thuisdialyse, nacht- of low care dialyse?
日本 Ronald Joppensz JAPAN Groep 1a door Lotte & Ronald.
Joppensz JAPAN Groep 3 door Pim & Ronald.
EMGO Institute for Health and Care Research Quality of Care Martina Cornel, Hoogleraar community genetics & public health genomics Genetische testen: Direct.
De Betekeniseconomie.
Chinese CAMA Gemeente Amsterdam heet u welkom!
Welkom in de Top-2000 kerkdienst
De geschiedenis van de Chinese taal
over oplossingsgerichte gespreksvoering
#5. MULTI-ACTOR SAMENWERKING | CITY-OF-THINGS
Wat te doen in het leven What To Do In Life Be Calm Wees Kalm
Space Station i.s.m.De PartyPuberZ
“There is as much living in a moment of pain as in a moment of joy”
A Healthy sense of Trust
Wat te doen in het leven What To Do In Life Be Calm Wees Kalm
Monitoring Report 2018: chapter 9 figures
Living in the Promised Land Leven in het Beloofde Land
Past simple vs present perfect
Moving Minds DNA.
Transcript van de presentatie:

郝柏林 复旦大学理论生命科学研究中心 中国科学院理论物理研究所 http://www.itp.ac.cn/~hao/ 从学科交叉漫谈 生物信息学 郝柏林 复旦大学理论生命科学研究中心 中国科学院理论物理研究所 http://www.itp.ac.cn/~hao/

科学、宗教与艺术 同源而殊途:同源于描述和解释自然、人类以及人和自然的关系。 数学是自然科学的“画笔”:定量而不仅是定性地掌握自然规律。 科学结论具有可以定量检验的预测能力。 “数学”和“定量”包括解析、数值、图形和其它主要由现代计算机提供的模拟手段。 物理学已经成为鼎立于实验、理论和计算三大支柱上的成熟的学科。生物是物,生物学也会受到物理学的启发。

生物是物 生物有理

天地有大美而不言,万物有成理而不说。夫圣人者原天地之美,而达万物之理。 庄子,《知北游》

物含妙理总堪寻 (北京颐和园铜亭出口处对联下联)

细推物理须行乐 何用浮名绊此身 杜甫 耳目之察,不足以分物理。 《淮南子。览冥训》 需要仪器观测和理论思维

电学和电生理学同时诞生 C. A. de Coulomb, 1785 L. Galvani, 1791 物理学与生物学的相互促进由来已久 电学和电生理学同时诞生 C. A. de Coulomb, 1785 L. Galvani, 1791

生物学为物理学启示过能量守恒 医生R. J. Mayer (1842):受动、静脉血色差别启发,第一个给出热功当量。 物理学家J. P. Joule (1843):热功当量。 现役军医H. von Helmholtz (1847):把能量守恒从机械运动推广到热、电、磁乃至生命现象。(24年后任物理教授) (感谢刘寄星博士核实姓名年代)

物理学为生物学提供过大量工具 光学显微镜(~1590): 细胞(1665) 细菌(Antonie van Leeuwenhoek,1683) (Muller确认细菌为一类生物, 1773) X射线衍射晶体结构分析 DNA双螺旋结构(JD Watson,FHC Crick,1953) 肌红蛋白、血红蛋白晶体结构(1957,1959) 电子显微镜、扫描电镜、隧道扫描电镜

物理学为生物学提供过大量工具 各种光谱方法、荧光标记 中子衍射 示踪原子、放射性标记 核磁共振波谱 质谱仪 “化学”仪器:超速离心机、液相色谱分析、圆偏振二向色性分析、凝胶电泳

物理学为生物学提供了新思想 负熵 非周期晶体 对热涨落的担心 三联码(George Gamow, 1954) 生物中的“标度”和“分形”

Erwin Schrodinger, What is Life Erwin Schrodinger, What is Life? The Physical Aspect of the Living Cell, 1944, … Michael P. Murphy and Luke A. J. O’Neill, eds. What is Life? The Next Fifty Years, Cambridge University Press, 1995, 1997.

分析 代数 几何 统计、概率和随机过程 离散数学:组合学、图论、语言学 数学是关于形和数的科学 分析 代数 几何 统计、概率和随机过程 离散数学:组合学、图论、语言学

生物有形 生物有数 生物有形,人所共识。地球上自然之美,多数来自生物本身和它们的营造。生物有数,则经历了漫长的认识过程。

生物有形 HIV 病毒 粘菌(Slime mold):自组织现象的实例

(恩格斯:1885) 于光远等译,《自然辩证法》, 人民出版社, 1984, 172页 “数学的应用:… 生物学中的数学=0.” (恩格斯:1885) 于光远等译,《自然辩证法》, 人民出版社, 1984, 172页

生物有数

生物多样性(宏观数据) 现存物种知多少? 从2 百万到10亿的种种估计 2003年11月初GenBank核酸数据库中有 154 089 种生物至少有1条数据 其中只有约半数有某些分类学信息 目前地球上存活着约 5000 种哺乳动物,约9000种鸟类 细菌是地球上最成功的物种,然而我们不知道它们的数目有多少

生物数据的产量 中国科学院基因组学研究所(“华大基因”)每天的测序能力:5000万碱基对(5*107) 一个人的基因组:3.2*109 碱基对 籼稻基因组:4.3*108碱基对 全世界每年生物数据产出量:1015字节 英国Sanger中心今后5年每年新增硬盘:80-100TB,即(0.8~1)*1014字节

GenBank 138版(2003年10月15日) 序列数: 29 819 397 (2981万) 核苷酸(字母)数: 35 599 621 471 (355亿) 序列平均长度: 1193

计算机:用火以来的最伟大发明 ENIAC(1944):每秒330次乘法运算 神威计算机:每秒3840亿次浮点运算 曙光3000计算机:每秒4000亿次浮点运算 每秒1万亿次=1012次/秒

数学、物理和计算机科学大有可为 生物学引论

地球上的自然史 ~13 Bys: 大爆炸 ~4.9 Bys: 太阳系和地球诞生 ~3.8 Bys: 地球上出现原始生命 ~550 Mys: 寒武纪(Cambrian)物种大爆发 ~425 Mys: 志留纪(Silurian)物种爆发 ~65 Mys: 恐龙灭绝 ~3.5 Mys: 化石古猿科与人科分离 ~0.7 Mys: 人类与黑猩猩分离 ~0.5 Mys: 北京人 (Homo erectus) ~0.4 Mys: 智人(Homo sapiens) ~100-20 Kys: 山顶洞人 221 BC, 2224年前:秦始皇统一中国

模式生物 噬菌体(Bacteriophage: lambda, T4, T7) 病毒(Viruses: SV40, HIV) 大肠杆菌(Escherichia coli) 酵母(Saccharomyces cerevisiae , yeast budding) 线虫(Caenorhabitidis elegans, nematode, worm) 果蝇(Drosophila melanogaster, fruitfly) 拟南芥(Arabidopsis thaliana) 水稻(Oryza sativa, rice) 非洲爪蟾(Xenopus laviae, African frog) 斑马鱼(Danio rerio, Zebra fish) 小鼠(Mus musculus, mouse) 智人(Homo sapiens)

遗传物质 核酸(DNA):线性和环状 质粒(Plasmids):线性和环状 染色体:DNA + 组蛋白 线粒体:有自己的DNA

生命现象的众多层次 系统生物学、生物复杂性、生态系统 生物多样性、种群动力学 动物行为科学 个体、器官、组织 细胞及其通信、信号传导 免疫网络、调控网络、代谢网络 复制、转录、剪接、翻译、运输 生物大分子: 蛋白质与核酸(DNA、RNA) 小分子(糖、脂肪、核苷酸、氨基酸)、金属离子、水 分子和原子的相互作用

来自我们工作的几个具体例子 完全基因组中的缺失和稀少字串:相关的组合学和语言学问题 籼稻基因组框架图:测序读出大量短串的拼接、重复序列带来的困难、长DNA链中寻找基因 细菌亲缘关系和分类学

细菌完全基因组中的缺失和稀少短核苷酸串 以大肠杆菌为例: 一个DNA环:4 639 221 个a,c,g,t字母 长度为8的短串共有种65536种 同长随机序列中平均每种串出现71次 实际情形如何?

C语言 + Xlib + Xtoolkit UNIX或LINUX平台 由GenBank取得基因组数据 背后的组合学和语言学问题 seeDNA程序演示 C语言 + Xlib + Xtoolkit UNIX或LINUX平台 由GenBank取得基因组数据 背后的组合学和语言学问题

水稻叶绿体基因组 可能曾经是一种光合细菌 全部由a、c、g、t四种核苷酸组成的序列 粳稻(日本1989):134525个字母籼稻(中国2001):134559个字母

cccaatatcttgcttcagcaagatattgggtatttctagctttcctttcttcaaaaattgctatatgttagcagaaaagccttatccattaagagatggaacttcaagagcagctaggtctagagggaagttgtgagcattacgttcgtgcattacttccataccaagattagcacggttgatgatatcagcccaagtattaataacgcgaccttggctatcaactacagattggttgaaattgaatccgtttagattgaaagccatagtactaatacctaaagcagtgaaccaaatccctactacaggccaagcagccaagaagaagtgtaaagaacgagagttgttaaaactagcatattggaagattaatcggccaaaataaccatgagcggccacaatattataagtttcttcctcttgaccaaatctgtaaccctcattagcagattcgttttcagtggtttccctgatcaaactagaggttaccaaggaaccatgcatagcactgaatagggaaccgccgaatacaccagctacacctaacatgtgaaatggatgcataaggatgttatgctctgcctggaatacaatcataaagttgaaagtaccagatattcctaaaggcataccatcagagaaacttccttgaccaatagggtaaatcaagaaaacagcagtagcagctgcaacaggagctgaatatgcaacagcaatccaaggacgcatacccagacggaaactcagttcccactcacgacccatataacaagctacaccaagtaagaagtgtagaacaattagctcataaggaccaccattgtataaccactcatcaacagatgcagcttcccaaattgggtaaaagtgcaatccgatcgccgcagaagtaggaataatggcaccagagataatattgtttccgtaaagtaaagaaccagaaacaggctcacgaataccatcaatatctactggaggggcagcgatgaaggcgataataaatacagaagttgcggtcaataaggtagggatcatcaaaacaccgaaccatccgatgtaaagacggttttcggtgctagttatccagttgcagaagcgaccccacaggcttgtactttcgcgtctctctaaaattgcagtcatggtaagatcttggtttattcaaattgcaaggactcccaagcacacgtattaactagaaagataatagaaggcttgttatttaacagtataatatagactatataccaatgtcaaccaagccagccccgacagttgtatatccatacaacaaaatttaccaaaccaaaaaattttgtaaatgaagtgagtgaaaaatcaaaactcagattgctcctttctagtttccatatgggttgcccgggactcgaacccggaactagtcggatggagtagataattattccttgttacaatagagaaaaaacctctccccaaatcgtgcttgcatttttcattgcacacgactttccctatgtagaaataggctatttctattccgaagaggaagtctactaatttttttagtagtaagttgattcacttactatttattatagtacagagaacatttcagaatggaaactgtgaaagttttaccttgatcatttatcaatcatttctagtttattagttttgtttaatgattaattaagaggattcaccagatcattgatacggagaatatccaaataccaaatacgctcactgtgcgatccacggaaagaaaagtaagttgttttggcgaacatcaaagaaaaaacttgctcttcttccgtaaaaaattcttctaaaaataccgaacccaaccattgcataaaagctcgtaccgtgcttttatgtttacgagctaaagttctagcgcatgaaagtcgaagtatatactttagtcgatacaaagtcttcttttttgaagatccactgtgataatgaaaaagatttctacatatccgaccaaaccgatcaagaatatcccaatccgataaatcggtccaaattggtttactaataggatgccccgatccagtacaaaattgggcttttgctaaagatccaatgagaggagtaacagggactttggtatcgaattttttcatttgagtatctattagaaatgaattctccagcatttgattccttactaacaaagaatttattggtacacttgaaaagtaccccagaaaatcgaagcaagagttttctaattggtttagatggatcctttgcggttgagtccaaaaagagaaagaatattgccacaaacggacaaggtaacatttccatttcttcttcaaaagaagagttccttttgatgcaagaattgcctttccttgatatcgaacataatgcataaggggatccataacgaaccatatggttttccgaaaaaaagcagggtacattaacccaaaatgttccatcttcctagaaaagatgattcgttccagaaaggttccggaagaagttaatcgcaagcaagaagattgtttacgaagaaacaacaagaaaaattcatattctgatacataagagttatataggaaccgaaatagtcttttattttcttttttcaaaataaaaatggatttcattgaagtaataaaactattccaattcgagtagtagttgagaaagaatcgcaataaatgcaaggatggaacatcttggatccggtattgaaggagttgaagcaagatatccaaatggataggatagggtatttctatatgtgctagataatgtaagtgcaaaaatttgtcttctaaaaaaggaaatattgaatgaatagatcgtaaattctgaaactttggtatttctttttcttccggacaagactgttctcgtagcgagaatgggatttctacaacgatcgcaaacccctcagatagaatctgagaataaaactcagaataaaaaaaattgttgtaatccaataatcgatcttggttaggatgattaaccaaattaatccaaaaattctgctgatacattcgaatcattaaccgtttcacaagtagtgaactaaatttcttgttattagaaccaataatttcgacaagttcggaaccatttaatccataatcatgggcaaacacataaatgtactcctgaaagagtagtgggtagacgaaatattgtctaggaaatttaagtttttctgaataaccctcgaatttttccatttgtatttctacttgaatcagagagagagaaatatttctcggtttatcaaatggtgatacatagtacaatatggtcagaacagggtgttgcattttttaatacaaacccctggggaagaaaaggagtctaatccacggatctttttccgctccttttctatccaatttgtttatgtttgttctaattacaaaagagaacaaatcctttatttttgcaggccaattgctcttttgactttgggatacagtctctttatcaatatactgcttcttttacacattcaatccataacatccttttcaatccaaaatcaagaataattaggatttctaaaaaaaaaagaaaaaatcaaaggtctactcataggaaaaccagcttttccctacatcaggcactaatctatttttaacgtctaattagatcagggagttcttccaattaagaagttaagctcgttgctttttgttttaccagaattggagccaggctctatccatttattcattagacccagaaaatcagaatttttttattccattccaaaaatccaaaataagaaattgattttattacgacatgctattttttccattcattacccttgaggatcagtcgcggtcttatagactctaccaagagtctggacgaattttttgcttcatccaaatgtgtaaaagatcatagtcgcacttaaaagccgagtactctaccattgagttagcaacccagataaactaggatcttagatacgatcgaaatccaaaaatcaatggaattacaccgcacacccctgtcaaaatcttaaaatagcaagacattaaaagaaagattttatcaccattgaaaacactcagataccaaaaggaacgggtctggttaaatttcactaaggttaaaagtggcaccaatcacgatcgtaaaattgtcatttttttagcatttttatttaaataaataaataaatcttgtatgagagtacaaacaagagggacaaccctaccatttgagcaaagtgtaggcaaaaaacctaatagggagtgaggataaagagacttatccatctacaaattctagatgttcaatggacctttgtcaatggaaatacaatggtaagaaaaaaattagatagaaaaactcaaaaaaataaaggcttatgttggattggcacgacataaatccagtcaaaaataggattaagaaagaggcaaattatttctaaatagttagacaacaagggatactagtgagcctctcctagttttttattcatttagttcttcaattaactcaaagttctttctttttctttaaagaattccgccttccttaaaatatcagaaacggttcttgtaggttgagcacctttttcaaggaaatagagaatagctggaacatttaaacaagtttgattctttatcggatcataaaaacctacttttcgaagatctcttccttctcttcgagatcgaacatcaattgcaacgattcgatagacagcttattgggatagatgtagataaataaagccccccctagaaacgtataggaggttttctcctcatacggctcgagaatatgacttgcattaatttccgtacagaaaaaacaaatttcatttatactcatgactcaagttgactaattttgattgacagacttgaaagaaaaaaatcctttgaaattttttgagtcgtctctaaactcttttctttgcctcatctcgaacaaattcacttttattccttattccggtccaattctattgttgagacagttgaaaatcgtgtttacttgttcgggaatcctttatctttgatttgtgaaatccttgggtttaaacattacttcgggaattcttattcttttttctttcaaaagagtagcaacatacccttttttcttatttccttcgataaagcatttccctcttctatagaaatcgaatatgagcgattgattctgatagactttaatcaaaagagttttcccatatcttccaaaattggactttcttcttattttaaccttttgatttctatattatttcgatttctatattaagggtagaatgacaaagttggcctaatttattagttttcactaaccctagattctttcccttgataaaaaataaattctgtcctctcgagctccatcgtgtactatttacttagcttacttacaaacaacccagcgaaaattcggttcgggacgaatagaacagactatgtcgagccaagagcattttcattactatggaaaatggtggatagcaaaatccacaatcgatcgtgtccttcaagtcgcacgttgctttctaccacatcgttttaaacgaagttttaacataacattcctctaatttcattgcaaagtgttatagggaattgatccaatatggatggaatcatgaatagtcattagtttcgttttttgtatactaattcaaacttgctttgctatctatggagaaatatgaataaaagaaattaagtatttatcgggaaagactccgcaaagagccaatttatttaaacccatattctatcatatgaatgaaatatagttcgaaaaaagggaataaacaagtttgcttaagacttatttattatggaatttccatcctcaacagaggactcgagatgatcaatccaatcctgaaatgataagagaagaattgactcttctccaacaaataaactatcaacctcccgtttaattaatttaattaatatattagattagcaatctatttttccataccatttttccgtaacaaaactaattaactattaactagttaaactattgcaatgaaaagaaagttttttggtagttatagaattctcgtatttcttcgactcgaataccaaaagaaagaaaaaaatgaagtaaaaaaaacgcatttcctgtaaagtaaaattaaggtctttgcttttacttattttttcttttacctaaaagaagcaactccaaatcaaaattgaatccattctatctaacgagcagttcttatcttatctttaccgggatggatcattctggatatttaaaaaatcgcggatcgagatcgtttttgcttaaccaaagaaagaaaaagaagaaggaaccttttttactaataaaatactataaaaaaaatttatctctatcataaatctatctctaccataaaggaataggtctcgttttttatacaatgttctacgtcaagtttaaaattttttcatgaaaaaaagattttcaatttgactggacttgacactggattatgttttctgagacagaaaatgaacgcattaggactgcatcgaatctaagagtttataagagaaaaaaattctctttaataaactttatgtctcgtgcagaatacaatacgatttcatctttcgtttcatcagaaaaaatctgggacggaaggattcgaacctccgagtaacgggaccaaaacccgctgccttaccacttggccacgccccatttcgggttttatgcgacactaataaacagtattatgtttatttcttattcgtcaatcctacttcaattacataaaaatggggggtattctcttggtaggattctagacatgcgaataatatagaatccaaaaaatgcattgatcattacatggaattctattaagatattatatgaaagtcgaatttcttccactctcatttgagagtgcgaatacaaggaggtattttgtgtttgggaaagtccgaagaaaaaaggattttgaatcctccttttcctttttcccttagaaaaataactcaatcaaaatccaattatctactctacaagaacgaaacgcttgttatgcctaatatacttagtttaacctgtatttgttttaattctgttatttatccgactagttttttcttcgccaaattgcccgaagcttatgccattttcaatccaatcgtggattttatgcctgtcatacctgtactcttttttctattagcctttgtttggcaagctgctgtaagttttcgatgaaatctttactactctgtctgccaaattgaatcatgtattcattctaaaaaaattcgaaaaatggataagagccgagaagtcttatattatgaaccttcgattctaaaattcaaattcttctacattgaatgtatagctgcagcaataaatttggatcagcctttctactccctgcatctacgttgagcaggtatctttaggtaaccgcacaatacctaacctaatttattgataagagtgcttattataaatcaattcttgcaatttttttcaaaaattgatttttgcatttttaggtgtcaaaataaacaaaacccatcctagtggatttgtgtggtaaggaaaaacgggtaatctattccttaaaaaaaaatcttggagattatgtaatgcttactctcaaactttttgtttatacagtagtgatattctttgtttccctctttatctttggattcttatctaatgatccaggacgtaatcctgggcgtgacgagtaaaaatccaaaattttttcttacaaattggatttgtttcatacatttatctacgagaaaatccgggggtcagaattccttccaattcgaaagtcccaaacgatccgagggggcggaaagagagggattcgaaccctcggtacaaaaaaattgtacaacggattagcaatccgccgctttagtccactcagccatctctccccgttccaaatcgaaaggtttccgtgatatgacagaggcaagaaataacgattgcaaaaaatccttcctttttctttcaaaagttcaaaaaaattatattgccaattccattttagttatattcttttttcttaatgttaataaaaaaaagaagaaaattcttcttttttctttctaattctaaaattggatattggctaaaagacaatcagatagattttctcttcagcaggcatttccatataggacttgttataataaaacaagcaggttatagaaaaaaactcttttttttattatttatcaacaaagcaaaaaggggtcttatcaaaccaacccaccccataaaattggaaagaaagataaagtaagtggacctgactccttgaatgaggcctctatccgctattctgatatataaattcgatgtagatgaaattgtataagtggatttttttgtatttccttagacttagaccacgcaaggcaagaatttctcgctatttactatttcatattcttgttactagatgttctataggaataagaagaaatcgcaacccctttccgctacacataaaaatggatttcgaaagtcaatttttcttttcaatatctttactttttttcagaatcctatttttgttcttatacccatgcaatagagagcgagtgggaaaagggaggttactttttttcattttttccttaaaaaataggctttcttggaaataggaatcatggaataatctgaattccaatgtttatttctatagtataagaaaaactaattgaatcaaattcatggatttaccacgacctcggctgtgaccccatagataaaaatgcaaaatttctatcttcgagaccattgaaaaaaggcattgaacgagaaaaaatcgtccacagataatctatcgtatgccttggaagtgatataaggtgctcggaaatggttgaagtaattgaataggaggatcactatgactatagcccttggtagagttactaaagaagaaaatgatttatttgatattatggacgactggttacgaagggaccgttttgtttttgtaggatggtctggcctattgctttttccttgtgcttatttcgctttaggaggttggtttacagggacaacttttgtaacttcttggtatacccatggattggcgagttcctatttggaaggttgcaatttcttaaccgcagcagtttccacccctgccaatagtttagcacactctttgttgctactatggggcccggaagcacaaggggattttactcgttggtgtcaattaggtggtctgtggacttttgttgctctccatggggcttttgcactaataggtttcatgttacgtcaatttgaacttgctcggtctgttcaattgcggccttataatgcaatttcattctctggcccaatcgctgtttttgtttccgtattcctgatttatccactggggcaatccggttggttctttgcgccgagttttggcgtagcagcgatatttcgattcatcctcttcttccaaggatttcataattggacgttgaacccatttcatatgatgggagttgccggagtattaggcgcggctctgctatgcgctattcatggggcaaccgtgga

寻找基因 生物知识体现为基因模型 基因模型的数学实现 马可夫、半马可夫和隐马可夫链 动态规划算法 语言学模型:生成语法

各种数学模型和算法 独立随机模型 马可夫、隐马可夫、半隐马可夫模型 聚类分析 判别分析(discriminance analysis) 动态规划算法 形式语言学方法

细菌分类 难处:形态性状少 形状:杆、球(单、双、链、葡萄)、 分枝、弯曲 着色:革兰氏阳性和阴性 生化:厌氧、固氮、脱硫 进展:16S rRNA序列、三界论(Carl Woese) 困惑:完全基因组带来问题 基因横向传递? 基因树不等于物种树

基于组分矢量的构树方法 基于K-肽计数的代表矢量 20K维空间中的距离 用K-2阶马可夫链扣除随机背景

基于132个完全基因组的亲缘树(K=6) 16 个古细菌 110 个真细菌 6 个真核生物

Towards a Paradigm Shift in Biology Walter Gilbert, Nature 349 (1991) The new paradigm, now emerging, is that all “genes” will be known (in the sense of being resident in databases available electronically), and that the starting point of a biological investigation will be theoretical. An individual scientist will begin with a theoretical conjecture, only then turning to experiments to follow or to test that hypothesis.

为新世纪培养“广谱”科学人才 数、理、化基础 生物知识 计算机和网络技能 从那门学科开始并不重要,要兼容并蓄而不排它,不为自己设限 大科学需要团队精神 做好自己的工作、尊重别人的工作;适应不同的思维方式和研究风格 学术界互相支持而不彼此拆台

适应不同的思维方法: 因果论和“目的论” 任何科学都来自对客观世界的反映 数理科学:“放之宇宙而皆准”的普遍原理、逻辑和演绎的方法 生命科学:小小地球上一定历史时期、一定空间和温度范围内的极其特殊的现象、归纳为主的方法 唯其特殊、所以复杂 不同的语言:因果和“目的”

汤佩松、王竹溪60多年前的贡献 J. Phys. Chem. 45 (1941) 443 (1940年 8月9日收到寄自昆明西南联大的文稿) 孤立细胞中水关系的热力学描述,使用化 学势,不同于当时的渗透压理论 1950年代国内的争论:汤王“败阵” 1960年代国外回到热力学理论 1980年代以后国际上注意到汤王早期工作 (感谢刘寄星博士提供素材)

参考书 1。郝柏林、刘寄星主编,《理论物理与生命科学》,上海科学技术出版社,1997,1999。 2。邹承鲁,《生物学在召唤》,上海科技教育出版社,1999。 3。郝柏林、张淑誉,《生物信息学手册》,上海科学技术出版社,2000,2002。 4。郝柏林,《生物信息学浅说》,上海科技教育出版社,2003。 5。“GOOGLE大学”:http://google.com

结束 谢谢!