位置:51电子网 » 技术资料 » 其它综合

预测蛋白质结构的拟物拟人算法

发布时间:2007/8/28 0:00:00 访问次数:639

来源:电子技术应用  作者:华中科技大学 曾卫华 黄文奇


摘要:根据国际上最新提出的蛋白质结构预测问题的三维欧氏空间的连续模型,找到相应的物理模型.并形成了相应的拟物拟人算法。


关键词:蛋白质结构预测拟物拟人算法折叠引力势能


蛋白质结构预测问题是当今最具有挑战和研究价值的课题之一。蛋白质工程正在发展成为可能影响人类生括许多方面的生物高技术。蛋白质工程的根本目的就是希望能够根据人类的需要设计并制造出具有特定功能的非天然蛋白质。

蛋白质的生物学功能取决于蛋白质的空闻折叠结
构。自上世纪50年代末以来,C.B.Anfinsen,K.A.Dill及K.F.Lau等人就发现蛋白质的空间折叠结构取决于构成该蛋白质的氨基酸的序列。也就是说蛋白质的空间折叠结构的全部信息都隐藏在蛋白质线性结构中。即氨基酸序列中。因此,从理论上讲人们可以通过控制蛋白质的氨基酸序列来控制蛋白质的空间折叠结构,从而控制所设计制造出的蛋白质的生物学功能。

1 用于蛋白质结构预测的三维连续数学模型
连续模型的描述为:对于任意给定的正整数n和任意地被确定了黑白颜色标号分别为l,2,……n的n个半径为0.5的小球(h代表黑球,p代表白球),如何调整这n个球的球心在三维欧氏空间中的位置,才能使这n个球两两互不嵌入,标号相邻的两个球皆相切,并且使其按如下公式(1)计算处于能量最低的状态,即值越小越好。



在此数学模型中,黑球h代表疏水氨基酸,白球p代表亲水氨基酸;长度为n的黑白球序列代表蛋白质氨基酸序列。数学模型(1)~(5)的解(x1,y1,z1,……xn,yn,zn)即为所求蛋白质在三维空间中的折叠结构。


2 求解蛋白质结构预测问题的拟物拟人算法
2.1 拟物算法的简述

在C.B.Anfmsen,K.A.Dill及Hsian-Ping Hsu等人的原始发现和后续工作的基础之上,受到他们的启发同时也观察到他们在实际中所遇到的困难,结合作者自身NP-hard问题求解中的经验提出如下的物理模型:将(1)~(5)式中涉及到的n个半径为0.5的球想象为光滑的弹性实体,想象第i个球与第i+1个球的球心之间有一根原始长度为1的弹簧相连(i=1,2,3,……n-1)。并且每个黑球和当前所有小球形成的系统的几何中心有一根原长为RR(RR为任意给的一个实数)的弹簧相连。设想这n个球现在被随机地撤在空间中。这样整个系统就会具有如下能量:
①编号不相邻的小球之间的万有引力所引起的引力势能;
②编号相邻的三个小球之间的角度所引起的角度势能;
③编号相邻的两个小球之间的弹簧拉力所引起的弹簧势能;
④编号不相邻的两个小球相互嵌入时所引起的嵌入势能;
⑤每个黑球和所有小球形成系统几何中心弹簧拉力所引起的弹簧势能。

在此过程中新加入的弹簧势能③和嵌入势能④的作用是在运动中逐渐使约束条件(4)和(5)得以满足,而黑球和系统几何中心的弹簧势能是笔者在实践工作中了解到黑球聚在一起时能量会更低些,因此这里加入了此能量来加快黑球聚拢。

在此拟物的思想下本文把在满足(4)和(5)式的条件下求解(1)式的最小值转换为求如下式子的最小值:



其中U1为(1)式中的能量E的值,n为黑白球总数,m为黑球的总数。

2.2 模型中新加入的能量分析及其物理意义

(1)相邻小球l和小球i+l之间的弹簧拉力所引起的弹簧势能如下:


其中Kn为物性系数,意义为弹簧的倔强系数,此式的物理意义为关于弹簧拉力的虎克定理。

(2)不相邻的小球i和小球j相互嵌入时的嵌入势能:



其中K斥为物性系数,意义为弹性球的倔强系数,此式的物理意义为关于弹性斥力的虎克定理。

(3)假设第i个小球为黑球,当前系统的几何中心坐标为,第i个黑球到几何中心引起的弹簧势能



其中K黑为物性系数,意义为弹簧的倔强系数,此式的物理意义为关于弹簧拉力的虎克定理。

2.3 模型的求解方法
经过以上的拟物处理后能量表达式(1)转换为(6)式在三维欧氏(x1,y1,z1,……xn,yn,zn)空间无约束条件的情况下求最小值。这里采用沿梯度的反方向运动求其最小值。其体系的运动方程为: 


来源:电子技术应用  作者:华中科技大学 曾卫华 黄文奇


摘要:根据国际上最新提出的蛋白质结构预测问题的三维欧氏空间的连续模型,找到相应的物理模型.并形成了相应的拟物拟人算法。


关键词:蛋白质结构预测拟物拟人算法折叠引力势能


蛋白质结构预测问题是当今最具有挑战和研究价值的课题之一。蛋白质工程正在发展成为可能影响人类生括许多方面的生物高技术。蛋白质工程的根本目的就是希望能够根据人类的需要设计并制造出具有特定功能的非天然蛋白质。

蛋白质的生物学功能取决于蛋白质的空闻折叠结
构。自上世纪50年代末以来,C.B.Anfinsen,K.A.Dill及K.F.Lau等人就发现蛋白质的空间折叠结构取决于构成该蛋白质的氨基酸的序列。也就是说蛋白质的空间折叠结构的全部信息都隐藏在蛋白质线性结构中。即氨基酸序列中。因此,从理论上讲人们可以通过控制蛋白质的氨基酸序列来控制蛋白质的空间折叠结构,从而控制所设计制造出的蛋白质的生物学功能。

1 用于蛋白质结构预测的三维连续数学模型
连续模型的描述为:对于任意给定的正整数n和任意地被确定了黑白颜色标号分别为l,2,……n的n个半径为0.5的小球(h代表黑球,p代表白球),如何调整这n个球的球心在三维欧氏空间中的位置,才能使这n个球两两互不嵌入,标号相邻的两个球皆相切,并且使其按如下公式(1)计算处于能量最低的状态,即值越小越好。



在此数学模型中,黑球h代表疏水氨基酸,白球p代表亲水氨基酸;长度为n的黑白球序列代表蛋白质氨基酸序列。数学模型(1)~(5)的解(x1,y1,z1,……xn,yn,zn)即为所求蛋白质在三维空间中的折叠结构。


2 求解蛋白质结构预测问题的拟物拟人算法
2.1 拟物算法的简述

在C.B.Anfmsen,K.A.Dill及Hsian-Ping Hsu等人的原始发现和后续工作的基础之上,受到他们的启发同时也观察到他们在实际中所遇到的困难,结合作者自身NP-hard问题求解中的经验提出如下的物理模型:将(1)~(5)式中涉及到的n个半径为0.5的球想象为光滑的弹性实体,想象第i个球与第i+1个球的球心之间有一根原始长度为1的弹簧相连(i=1,2,3,……n-1)。并且每个黑球和当前所有小球形成的系统的几何中心有一根原长为RR(RR为任意给的一个实数)的弹簧相连。设想这n个球现在被随机地撤在空间中。这样整个系统就会具有如下能量:
①编号不相邻的小球之间的万有引力所引起的引力势能;
②编号相邻的三个小球之间的角度所引起的角度势能;
③编号相邻的两个小球之间的弹簧拉力所引起的弹簧势能;
④编号不相邻的两个小球相互嵌入时所引起的嵌入势能;
⑤每个黑球和所有小球形成系统几何中心弹簧拉力所引起的弹簧势能。

在此过程中新加入的弹簧势能③和嵌入势能④的作用是在运动中逐渐使约束条件(4)和(5)得以满足,而黑球和系统几何中心的弹簧势能是笔者在实践工作中了解到黑球聚在一起时能量会更低些,因此这里加入了此能量来加快黑球聚拢。

在此拟物的思想下本文把在满足(4)和(5)式的条件下求解(1)式的最小值转换为求如下式子的最小值:



其中U1为(1)式中的能量E的值,n为黑白球总数,m为黑球的总数。

2.2 模型中新加入的能量分析及其物理意义

(1)相邻小球l和小球i+l之间的弹簧拉力所引起的弹簧势能如下:


其中Kn为物性系数,意义为弹簧的倔强系数,此式的物理意义为关于弹簧拉力的虎克定理。

(2)不相邻的小球i和小球j相互嵌入时的嵌入势能:



其中K斥为物性系数,意义为弹性球的倔强系数,此式的物理意义为关于弹性斥力的虎克定理。

(3)假设第i个小球为黑球,当前系统的几何中心坐标为,第i个黑球到几何中心引起的弹簧势能



其中K黑为物性系数,意义为弹簧的倔强系数,此式的物理意义为关于弹簧拉力的虎克定理。

2.3 模型的求解方法
经过以上的拟物处理后能量表达式(1)转换为(6)式在三维欧氏(x1,y1,z1,……xn,yn,zn)空间无约束条件的情况下求最小值。这里采用沿梯度的反方向运动求其最小值。其体系的运动方程为: 


相关IC型号

热门点击

 

推荐技术资料

罗盘误差及补偿
    造成罗盘误差的主要因素有传感器误差、其他磁材料干扰等。... [详细]
版权所有:51dzw.COM
深圳服务热线:13751165337  13692101218
粤ICP备09112631号-6(miitbeian.gov.cn)
公网安备44030402000607
深圳市碧威特网络技术有限公司
付款方式


 复制成功!