Proteinler, hayatın temel yapı taşlarından biri olup bedende kas gelişimi ve hastalıklarla çaba üzere pek çok değerli fonksiyonu yerine getirir. EsmGFP ismi verilen yeni modellenmiş protein, şu an sırf bir bilgisayar kodu olarak mevcut olsa da, daha evvel keşfedilmemiş bir yeşil floresan protein tipinin planlarını içeriyor. Tabiatta, yeşil floresan proteinler, denizanası ve mercanlar üzere canlılara parlaklık kazandıran bir özellik gösteriyor.
Technologijos’in haberine nazaran EsmGFP’nin imaline ait talimatları içeren harf dizisinin sadece %58’i tamamlandı. Bu protein, bilinen en yakın floresan proteine benzerlik gösteriyor ve renkli deniz canlılarının dokunaçlarının uçlarında baloncuklar varmış üzere görünen kabarcık deniz anemonlarında (Entacmaea quadricolor) bulunan bir proteinin insan tarafından değiştirilmiş versiyonudur. Fakat, dizinin geri kalan kısmı büsbütün eşsiz olup, evrimleşmesi için toplamda 96 farklı genetik mutasyon gerektiriyor. Araştırmalara nazaran, bu değişikliklerin tabiatta ortaya çıkabilmesi için 500 milyondan fazla yılın geçmesi gerekirdi.
EvolutionaryScale’deki araştırmacılar, geçtiğimiz yıl bir ön çalışmada EsmGFP’yi ve bunu oluşturmak için kullanılan yapay zeka modeli ESM3’ü tanıttılar. 16 Ocak’ta yayımlanan bu bulgular, şu anda bağımsız araştırmacılar tarafından inceleniyor ve Science mecmuasında yayımlandı.
Boşlukları doldurmasını söylediler
ESM3, evrimin klâsik kısıtlamalarının ötesinde proteinler tasarlar. Bu model, bilim insanlarının sağladığı eksik protein kodundaki boşlukları doldurarak, muhtemel tüm evrimsel yolları göz önünde bulundurup, bu proteinlerin var olabileceği halleri tasarlayan bir sorun çözme aracıdır.
Çalışmanın ortak muharriri ve EvolutionaryScale’in kurucu ortağı, baş bilim insanı Alex Rives, “ESM3’ün temel biyolojiyi öğrendiğini ve evrimsel süreçler tarafından keşfedilen alanların dışında işlevsel proteinler üretebildiğini keşfettik,” diyor.
Yeni araştırma, Rives ve meslektaşlarının 2024’ten evvel Meta’da başlattıkları çalışmalar üzerine inşa edilerek EvolutionaryScale’in temellerini atıyor. ESM3, OpenAI’nin GPT-4 modeline emsal halde çalışan, lakin biyolojiye odaklanmış üretken bir lisan modelinin en son versiyonudur.
Proteinler, amino asit ismi verilen ve dizilimi genler tarafından belirlenen moleküler zincirlerden oluşur. Her proteinin farklı amino asit dizileri bulunur ve yapısal olarak da birbirlerinden ayrılırlar. Nature Education’a nazaran, her protein, fonksiyonlarını yerine getirmesine imkan tanıyan eşsiz bir biçime katlanır. ESM3’ün proteinleri anlamasına yardımcı olmak hedefiyle, araştırmacılar model bilgilerini, proteinin temel özellikleri olan amino asit dizisi, yapısı ve fonksiyonu hakkında bir dizi harfle beslediler.
ESM3 Ekibi, tabiatta bulunan proteinlerin bilgileri için 2,78 milyar dolardan daha az bir ödeme yaptı. Araştırmacılar, proteinin birtakım kısımlarını rastgele gizleyerek, ESM3’e öğrendiklerine dayanarak kodu tamamlamasını sağlamak için boşlukları doldurmasını söylediler.
Rives, durumu şöyle açıklıyor: “Tıpkı bir insanın ‘Hamlet’in monologunda’ eksik sözleri doldurabilmesi üzere, biz de proteinlerdeki boşlukları doldurmak için bir lisan modeli eğitebiliriz.” “Araştırmamız, bu kolay sorunu çözmenin, protein biyolojisinin derin yapısı hakkında kıymetli bilgiler ortaya koyduğunu gösterdi.”
Protein mühendisliği uygulamalarını hızlandıracak
Bilim insanları, doğal proteinleri çeşitli maksatlarla değiştirme ve yeni proteinler yaratma konusunda kıymetli ilerlemeler kaydediyor. Örneğin, yeşil floresan proteinler, araştırma laboratuvarlarında yaygın olarak kullanılıyor. Bu proteinleri yeşil hale getirmek için genetik kodları, sıklıkla öbür DNA dizilerinin uçlarına ekleniyor, bu da bilim insanlarının proteinleri ve hücresel süreçleri basitçe izlemelerini sağlıyor. Rives, ESM3’ün yeteneklerinin, yeni ilaçların geliştirilmesi üzere çok çeşitli protein mühendisliği uygulamalarını hızlandırabileceğini belirtti.
2024 yılında Bath Üniversitesi’nde evrimsel biyoloji uzmanı olarak misyon yapan Tiffany Taylor, bu çalışmaya katılmadı lakin çalışmanın şimdi hakemli olmayan bir ön versiyonunu inceledi. Tahlilinde, ESM3 üzere yapay zeka modellerinin, evrimin sağladığı yeniliklerin ötesine geçerek protein mühendisliğinde yeni imkanlar yaratabileceğini söz etti. Lakin, araştırmacıların simüle ettikleri 500 milyon yıllık evrimin sadece ferdî proteinlere odaklandığını ve doğal seçilimin uzun süreçlerini göz gerisi ettiğini de vurguladı. Taylor, “Yapay zeka takviyeli protein mühendisliği heyecan verici olsa da, milyonlarca yıl süren doğal seçilimin mükemmelleştirdiği karmaşık süreçleri, yalnızca zekamızla alt edebileceğimizi düşünerek kendimize çok güvendiğimiz hissine kapılıyorum,” dedi.