Биологийн өгөгдлийн шинжилгээ нь амьд организмтай холбоотой өгөгдлийг боловсруулах, шинжлэх, тайлбарлах биологи, компьютерийн шинжлэх ухааны зарчмуудыг нэгтгэсэн салбар дундын салбар юм. Биологийн өгөгдлөөс утга учиртай мэдээлэл гаргаж авахыг онцлон тэмдэглэснээр энэ нь биологийн цогц систем, өвчний талаарх бидний ойлголтыг ахиулахад чухал үүрэг гүйцэтгэдэг.
Биологийн өгөгдөл нь генетикийн дараалал, уургийн бүтэц, эсийн зураг, экологийн хэмжилт зэрэг олон төрлийн мэдээллийн төрлийг багтаадаг. Энэхүү өгөгдлийн нарийн төвөгтэй байдал, хэмжээ нь түүнийг шинжлэхэд үр ашигтай тооцооллын аргыг шаарддаг.
Нуклеотидын хэлхээс (аденин (А), тимин (Т), цитозин (С), гуанин (G)) -ээс бүрдэх генетикийн дараалал нь амьдралын хэв маягийг бүрдүүлдэг. Эдгээр дарааллыг шинжлэх нь эрдэмтэд генийг тодорхойлох, генетикийн өөрчлөлтийг ойлгох, төрөл зүйлийн хоорондын хувьслын харилцааг судлах боломжийг олгодог. Жишээлбэл, дарааллыг тохируулах аргыг янз бүрийн организмын ДНХ-ийн дарааллын хоорондох ижил төстэй байдал, ялгааг олоход ашигладаг бөгөөд энэ нь удамшлын өвчин, хувьслын холболтыг ойлгоход чиглэгддэг.
Амьдралын барилгын материал болох уургууд нь организмын дотор олон тооны үүрэг гүйцэтгэдэг цогц молекулууд юм. Уургийн бүтцийг тодорхойлох нь эрдэмтэд түүний үйл ажиллагаа, бусад молекулуудтай харилцан үйлчлэлийг урьдчилан таамаглахад тусалдаг. Молекулын динамикийн симуляци зэрэг тооцооллын хэрэгслүүд нь атомын түвшинд уургийн хөдөлгөөн, нугалахад дүн шинжилгээ хийж, өвчний механизм болон эмчилгээний боломжит зорилтуудын талаархи ойлголтыг санал болгодог.
Биологийн өгөгдлийн асар том цар хүрээ нь түүнийг шинжлэх, тайлбарлахын тулд хүчирхэг тооцооллын аргуудыг шаарддаг. Машины сургалт, хиймэл оюун ухаан, өгөгдөл олборлолт зэрэг компьютерийн шинжлэх ухааны гол салбарууд нь биологийн өгөгдлийн шинжилгээг ахиулахад ихээхэн хувь нэмэр оруулдаг.
Жишээлбэл, машин сургалтын алгоритмууд нь одоо байгаа өгөгдөл дээр үндэслэн биологийн үзэгдлийг ангилж, урьдчилан таамаглах боломжтой. Геномийн шинжлэх ухаанд машин сургалтын хэрэглээ нь хувь хүнийг тодорхой өвчинд нэрвэгдэх генетикийн дарааллын хэв маягийг тодорхойлох явдал юм. Удамшлын мэдээллийн асар их өгөгдлийн багцын загваруудыг сургаснаар судлаачид өвчин үүсэх магадлалыг урьдчилан таамаглаж, эрт оношлох, хувь хүнд тохирсон анагаах ухаанд тусалдаг.
Өгөгдлийн үр дүнтэй дүрслэл, дүрслэл нь биологийн мэдээллийн шинжилгээний үндэс юм. Биологийн мэдээллийн цогц шинж чанар нь ойлголтыг сайжруулах, ойлголтыг хөнгөвчлөхийн тулд график дүрслэлийг шаарддаг. Филогенетик мод гэх мэт хэрэгслүүд нь хувьслын харилцааг нүдээр илэрхийлдэг бол дулааны зураглал нь янз бүрийн нөхцөл байдал, эмчилгээний явцад генийн илэрхийлэлийн түвшинг харуулж чаддаг. Ийм дүрслэл нь судлаачдад өгөгдлийн хэв маяг, гажуудлыг илүү хялбараар ялгах боломжийг олгодог.
Био-информатик мэдээллийн сан нь биологийн өгөгдлийг хадгалах, зохион байгуулах зориулалттай тусгай сан юм. Нуклеотидын дарааллын GenBank, уургийн бүтцийн уургийн мэдээллийн сан зэрэг эдгээр мэдээллийн сан нь дэлхийн судлаачдад үнэлж баршгүй эх сурвалж болдог. Эдгээр мэдээллийн санд хандсанаар эрдэмтэд одоо байгаа өгөгдлийг задлан шинжлэх, харьцуулах, таамаглалыг шалгах боломжийг олгодог.
Метагеномик нь хүрээлэн буй орчны дээжээс шууд олж авсан геномын материалыг судлах боломжийг олгодог хүчирхэг арга юм. Энэ арга нь бичил биетний бүлгэмдэл, тэдгээрийн янз бүрийн экосистем дэх үүргийн талаарх бидний ойлголтод хувьсгал хийсэн. Судлаачид дээжээс ДНХ-ийн дарааллыг гаргаснаар одоо байгаа бичил биетний төрөл зүйл, тэдгээрийн функциональ үүргийг өсгөвөрлөх шаардлагагүйгээр тодорхойлж чадна.
Жишээ нь янз бүрийн орчны хөрсөн дэх бичил биетний олон янз байдалд дүн шинжилгээ хийх явдал юм. ДНХ-г гаргаж аваад дараалалд оруулсны дараа биоинформатикийн хэрэгслийг дарааллыг угсарч, генийг тэмдэглэдэг. Энэ үйл явц нь янз бүрийн бичил биетний төрөл зүйл, тэдгээрийн бодисын солилцооны боломжит замыг илрүүлж, эрдэмтэд бичил биетний бүлгүүдэд хүрээлэн буй орчны нөлөөллийг ойлгоход тусалдаг ба эсрэгээр.
Биологийн өгөгдлийн шинжилгээний ирээдүй нь тооцоолох хүчин чадал, машин сургалтын алгоритмууд, өгөгдөл хадгалах чадавхи зэрэг дэвшилтүүдээр тодорхойлогддог. Эдгээр бүтээн байгуулалтууд нь бидний өгөгдлийг урьд өмнө хэзээ ч байгаагүй их хэмжээгээр боловсруулах чадварыг сайжруулж, хувийн анагаах ухаан, хүрээлэн буй орчны биологи болон бусад салбарт шинэ хил хязгаарыг нээхийг амлаж байна. Бид биологийн системийн нарийн төвөгтэй байдлыг үргэлжлүүлэн задлахын хэрээр биологийн өгөгдлийг бодитой мэдлэг болгон хувиргахад компьютерийн шинжлэх ухааны техникийг нэгтгэх нь чухал хэвээр байх болно.