Chan Zuckerberg Girişimi'nin rBio'su, laboratuvar çalışmalarını atlayarak yapay zekayı eğitmek için sanal hücreleri kullanıyor

Gelen kutunuza daha akıllı içgörüler mi gelsin? Kurumsal yapay zeka, veri ve güvenlik liderleri için yalnızca önemli olan bilgileri almak için haftalık bültenlerimize kaydolun. Hemen Abone Olun
Chan Zuckerberg Girişimi, Perşembe günü, pahalı laboratuvar deneyleri gerektirmek yerine sanal simülasyonlar kullanarak hücre biyolojisi hakkında akıl yürütmek üzere eğitilen ilk yapay zeka modeli olan rBio'nun piyasaya sürüldüğünü duyurdu. Bu, biyomedikal araştırmaları ve ilaç keşfini önemli ölçüde hızlandırabilecek bir atılım.
bioRxiv'de yayınlanan bir araştırma makalesinde ayrıntıları verilen akıl yürütme modeli, yalnızca deneysel verilere güvenmek yerine, sanal hücre modellerinden gelen tahminleri eğitim sinyalleri olarak kullanan " yumuşak doğrulama " adı verilen yeni bir yaklaşımı göstermektedir. Bu paradigma değişimi, araştırmacıların maliyetli laboratuvar çalışmalarına zaman ve kaynak ayırmadan önce biyolojik hipotezleri hesaplamalı olarak test etmelerine yardımcı olabilir.
CZI'da kıdemli araştırma bilimcisi ve araştırmanın başyazarı Ana-Maria Istrate, bir röportajında, "Fikir şu ki, bu süper güçlü hücre modellerine sahip olmak ve bunları laboratuvarda deneysel olarak test etmek yerine sonuçları simüle etmek için kullanabilirsiniz," dedi. "Şimdiye kadarki paradigma, biyolojideki çalışmaların %90'ının laboratuvarda deneysel olarak test edilmesi, %10'unun ise hesaplamalı olmasıydı. Sanal hücre modelleriyle bu paradigmayı tersine çevirmek istiyoruz."
Bu duyuru, CZI'nin "bu yüzyılın sonuna kadar tüm hastalıkları tedavi etmek, önlemek ve yönetmek" şeklindeki iddialı hedefi için önemli bir dönüm noktasını temsil ediyor. Çocuk doktoru Priscilla Chan ve Meta CEO'su Mark Zuckerberg'in liderliğinde, 6 milyar dolarlık hayırseverlik girişimi kaynaklarını giderek artan bir şekilde yapay zeka ve biyolojinin kesişim noktasına odakladı.
Yapay Zeka Ölçeklendirmesi Sınırlarına Ulaştı
Güç sınırlamaları, artan token maliyetleri ve çıkarım gecikmeleri, kurumsal yapay zekayı yeniden şekillendiriyor. En iyi ekiplerin nasıl çalıştığını keşfetmek için özel salonumuza katılın:
- Enerjiyi stratejik bir avantaja dönüştürmek
- Gerçek verimlilik kazanımları için verimli çıkarım mimarisi oluşturma
- Sürdürülebilir yapay zeka sistemleriyle rekabetçi yatırım getirisinin kilidini açma
Önde kalmak için yerinizi ayırtın : https://bit.ly/4mwGngO
rBio, yapay zekanın biyolojik araştırmalara uygulanmasında temel bir zorluğun üstesinden geliyor. ChatGPT gibi büyük dil modelleri metin işlemede mükemmel olsa da, biyolojik temel modelleri genellikle doğal dilde kolayca sorgulanamayan karmaşık moleküler verilerle çalışır. Bilim insanları, güçlü biyolojik modeller ile kullanıcı dostu arayüzler arasındaki bu boşluğu kapatmakta zorlandılar.
Istrate, "Biyolojinin temel modelleri -GREmLN ve TranscriptFormer gibi modeller- biyolojik veri biçimleri üzerine kuruludur; bu da onlarla doğal dilde etkileşime giremeyeceğiniz anlamına gelir," diye açıkladı. "Onları harekete geçirmenin karmaşık yollarını bulmanız gerekir."
Yeni model, 1,5 milyar yıllık evrim sürecini kapsayan 12 türe ait 112 milyon hücre üzerinde eğitilmiş sanal bir hücre modeli olan CZI'nin TranscriptFormer'ından elde edilen bilgiyi, araştırmacıların sade İngilizce ile sorgulayabileceği bir konuşma AI sistemine dönüştürerek bu sorunu çözüyor.
Temel yenilik , rBio'nun eğitim metodolojisinde yatmaktadır. Geleneksel akıl yürütme modelleri, matematiksel denklemler gibi kesin cevapları olan sorulardan öğrenir. Ancak biyolojik sorular, ikili kategorilere tam olarak uymayan belirsizlik ve olasılıksal sonuçlar içerir.
Yapay Zeka Kıdemli Direktörü Theofanis Karaletsos ve Istrate liderliğindeki CZI araştırma ekibi, orantılı ödüllerle takviyeli öğrenmeyi kullanarak bu zorluğun üstesinden geldi. Model, basit evet-hayır doğrulaması yerine, sanal hücre simülasyonlarıyla belirlenen biyolojik tahminlerinin gerçeklikle örtüşme olasılığına orantılı ödüller alıyor.
Araştırma makalesinde , "Lisansüstü öğrencilerinin (LLM) eğitimine yeni yöntemler uyguladık," diye açıklanıyor. "Ekip, hazır bir dil modelini temel alarak, rBio'yu takviyeli öğrenmeyle eğitti. Bu, modelin doğru cevaplar için ödüllendirildiği yaygın bir teknik. Ancak araştırmacılar, bir dizi evet/hayır sorusu sormak yerine, ödülleri modelin cevaplarının doğru olma olasılığına göre ayarladılar."
Bu yaklaşım, bilim insanlarının "A geninin etkilerinin bastırılması B geninin aktivitesinde artışa neden olur mu?" gibi karmaşık sorular sormalarına ve sağlıklı durumdan hastalıklı duruma geçiş de dahil olmak üzere hücresel değişiklikler hakkında bilimsel olarak temellendirilmiş yanıtlar almalarına olanak tanır.
Gen bozulması tahminini değerlendirmek için standart bir veri seti olan PerturbQA kıyaslamasına göre yapılan testlerde rBio, deneysel veriler üzerinde eğitilen modellerle rekabetçi bir performans gösterdi. Sistem, temel büyük dil modellerini geride bıraktı ve temel metriklerde uzmanlaşmış biyolojik modellerin performansıyla eşleşti.
Özellikle dikkat çekici olan, rBio'nun güçlü " transfer öğrenme " yetenekleri göstermesi, TranscriptFormer'dan öğrenilen gen ortak ifade kalıpları hakkındaki bilgiyi gen bozulması etkileri hakkında doğru tahminler yapmak için başarıyla uygulamasıdır; bu tamamen farklı bir biyolojik görevdir.
Araştırmacılar, "PerturbQA veri setinde, yumuşak doğrulayıcılar kullanılarak eğitilen modellerin, dağıtım dışı hücre hatları üzerinde genelleme yapmayı öğrendiğini ve potansiyel olarak hücre hattına özgü deneysel veriler üzerinde eğitim alma ihtiyacını ortadan kaldırdığını gösteriyoruz" diye yazdı.
Adım adım akıl yürütmeyi teşvik eden düşünce zinciri yönlendirme teknikleriyle güçlendirildiğinde rBio, önceki lider model SUMMER'ı geride bırakarak son teknoloji bir performansa ulaştı.
rBio duyurusu, CZI'nin sosyal adalet ve eğitim reformunu da içeren geniş kapsamlı bir hayırseverlik misyonundan bilimsel araştırmalara daha hedefli bir vurguya odaklanarak önemli organizasyonel değişikliklere gitmesiyle aynı döneme denk geldi. Bu değişim, kuruluşun ilerici amaçlardan vazgeçtiğini gören bazı eski çalışanlar ve bağışçılardan eleştiri aldı.
Ancak, CZI'da altı yıldır çalışan Istrate için biyolojik yapay zekaya odaklanmak, uzun süredir devam eden önceliklerin doğal bir evrimini temsil ediyor. "Deneyimim ve çalışmalarım pek değişmedi. CZI'da olduğum sürece bilim girişiminin bir parçasıyım," dedi.
Sanal hücre modellerine odaklanma, yaklaşık on yıllık temel çalışmalara dayanmaktadır. CZI, türler arasında farklı hücre tiplerinde hangi genlerin aktif olduğunu gösteren kapsamlı veritabanları olan hücre atlasları oluşturmaya ve büyük biyolojik modelleri eğitmek için gereken hesaplama altyapısını geliştirmeye büyük yatırımlar yapmıştır.
Istrate, kuruluşun daha önce veri platformlarına ve tek hücreli transkriptomiklere yaptığı yatırımlara atıfta bulunarak, "CZI'da yıllardır devam eden çalışmalar hakkında gerçekten heyecanlıyım, çünkü bu ana kadar hep birlikte çalıştık" dedi.
CZI'nin yaklaşımının kritik avantajlarından biri, yıllardır titizlikle veri toplamasından kaynaklanmaktadır. Kuruluş, tek hücreli biyolojik verilerin en büyük depolarından biri olan ve bilgilerin titiz kalite kontrol süreçlerinden geçtiği CZ CELLxGENE'i işletmektedir.
Istrate, "Transkriptomik için öncü ilk veri atlaslarından bazılarını oluşturduk ve bunlar, hücre tipleri, köken, dokular ve donörler açısından önyargıyı en aza indirmek amacıyla çeşitlilik göz önünde bulundurularak oluşturuldu" diye açıkladı.
Veri kalitesine gösterilen bu özen, tıbbi kararları etkileyebilecek yapay zeka modellerinin eğitilmesinde kritik öneme sahiptir. Kamuya açık ancak potansiyel olarak önyargılı veri kümelerine dayanan bazı ticari yapay zeka çalışmalarının aksine, CZI'nin modelleri, çeşitli popülasyonları ve hücre tiplerini temsil edecek şekilde tasarlanmış, özenle seçilmiş biyolojik verilerden yararlanır.
CZI'nin açık kaynaklı geliştirmeye olan bağlılığı, onu Google DeepMind ve tescilli yapay zeka araçları geliştiren ilaç şirketleri gibi ticari rakiplerinden ayırıyor. rBio da dahil olmak üzere tüm CZI modelleri, kuruluşun Sanal Hücre Platformu aracılığıyla ücretsiz olarak kullanılabilir ve ücretsiz Google Colab dizüstü bilgisayarlarında çalışabilen eğitimlerle birlikte sunulur.
Istrate, "Açık kaynak kodlu parçanın çok önemli olduğunu düşünüyorum, çünkü bu, CZI'yi kurduğumuzdan beri sahip olduğumuz temel bir değer," dedi. "Çalışmalarımızın temel hedeflerinden biri bilimi hızlandırmak. Bu yüzden yaptığımız her şeyi yalnızca bu amaç için açık kaynaklı hale getirmek istiyoruz."
Bu strateji, gelişmiş biyolojik yapay zeka araçlarına erişimi demokratikleştirmeyi ve bu tür modelleri bağımsız olarak geliştirmek için gerekli kaynaklara sahip olmayan daha küçük araştırma kurumları ve girişimlere potansiyel olarak fayda sağlamayı amaçlamaktadır. Bu yaklaşım, CZI'nin hayırsever misyonunu yansıtırken, bilimsel ilerlemeyi hızlandırabilecek ağ etkileri de yaratmaktadır.
Potansiyel uygulamalar akademik araştırmaların çok ötesine uzanıyor. Bilim insanlarının gen etkileşimleri ve hücresel tepkiler hakkındaki hipotezleri hızla test etmelerini sağlayarak rBio, ilaç keşfinin erken aşamalarını önemli ölçüde hızlandırabilir; bu süreç genellikle onlarca yıl sürer ve milyarlarca dolara mal olur.
Modelin, gen bozukluklarının hücresel davranışı nasıl etkilediğini tahmin etme yeteneği, araştırmacıların belirli genetik değişikliklerin hastalığın ilerlemesine nasıl katkıda bulunduğunu belirlemesi gereken Alzheimer gibi nörodejeneratif hastalıkları anlamak için özellikle değerli olabilir.
Araştırma makalesinde, "Bu soruların yanıtları, Alzheimer gibi nörodejeneratif hastalıklara katkıda bulunan gen etkileşimleri hakkındaki anlayışımızı şekillendirebilir," deniyor. "Bu tür bilgiler, daha erken müdahaleye ve belki de bir gün bu hastalıkların tamamen durdurulmasına yol açabilir."
rBio, CZI'nin birden fazla biyolojik alandan gelen bilgiyi entegre eden "evrensel sanal hücre modelleri" oluşturma yönündeki daha geniş vizyonunun ilk adımını temsil ediyor. Şu anda araştırmacılar, farklı biyolojik veri türleri (transkriptomik, proteomik, görüntüleme) için ayrı modellerle çalışmak zorunda kalıyor ve bu da içgörüleri birleştirmenin kolay yollarını sunmuyor.
Istrate, "Önümüzdeki en büyük zorluklardan biri, bu sanal hücre modellerini oluşturmak ve hücreleri anlamak. Önümüzdeki birkaç yıl boyunca da bahsettiğim gibi, tüm bu süper güçlü biyoloji modellerinden elde edilen bilgiyi nasıl entegre edeceğimizdir," dedi. "Asıl zorluk, tüm bu bilgiyi tek bir alanda nasıl entegre edeceğimizdir."
Araştırmacılar, bu entegrasyon kabiliyetini, gen ifadesi verileri için TranscriptFormer, bozulma tahmini için özel sinir ağları ve Gen Ontolojisi gibi bilgi veritabanları gibi birden fazla doğrulama kaynağını birleştiren rBio modellerini eğiterek kanıtladılar. Bu birleşik modeller, tek kaynaklı yaklaşımlardan önemli ölçüde daha iyi performans gösterdi.
Umut verici performansına rağmen, rBio bazı teknik zorluklarla karşı karşıyadır. Modelin mevcut uzmanlığı öncelikle gen bozulması tahminine odaklansa da, araştırmacılar TranscriptFormer tarafından kapsanan herhangi bir biyolojik alanın teorik olarak dahil edilebileceğini belirtmektedir.
Ekip, kullanıcı deneyimini iyileştirmek ve modelin uzmanlık alanı dışındaki yanıtları vermesini önlemek için uygun koruma önlemlerini uygulamaya koyma konusunda çalışmaya devam ediyor. Bu, uzmanlaşmış alanlar için büyük dil modellerinin dağıtımında karşılaşılan yaygın bir zorluktur.
Araştırma makalesinde, "rBio araştırmaya hazır olsa da, modelin mühendislik ekibi kullanıcı deneyimini iyileştirmeye devam ediyor, çünkü akıl yürütme modellerini konuşmaya dönüştüren esnek problem çözme aynı zamanda bir dizi zorluk da yaratıyor" ifadeleri yer alıyor.
rBio'nun geliştirilmesi, yapay zeka destekli ilaç keşfinde artan rekabet ortamında gerçekleşiyor. Büyük ilaç şirketleri ve teknoloji firmaları, ilaçların keşfedilme ve geliştirilme biçimini dönüştürme potansiyelini fark ederek, biyolojik yapay zeka yeteneklerine milyarlarca dolar yatırım yapıyor.
CZI'nin açık kaynaklı yaklaşımı, gelişmiş araçları daha geniş bir araştırma topluluğunun kullanımına sunarak bu dönüşümü hızlandırabilir. Akademik araştırmacılar, biyoteknoloji girişimleri ve hatta köklü ilaç şirketleri artık, aksi takdirde önemli miktarda dahili yapay zeka geliştirme çabası gerektirecek yeteneklere erişebiliyor.
Trump yönetiminin Ulusal Sağlık Enstitüleri bütçesinde önemli kesintiler önermesi ve bunun biyomedikal araştırmalar için kamu fonlarını tehdit etmesi nedeniyle zamanlama önemli hale geliyor. CZI'nin biyolojik yapay zeka altyapısına yaptığı sürekli yatırım, hükümet desteğinin azaldığı dönemlerde araştırma ivmesinin korunmasına yardımcı olabilir.
rBio'nun lansmanı, yapay zeka alanında sıradan bir atılımdan çok daha fazlasını temsil ediyor; biyolojik araştırmaların nasıl yürütülebileceği konusunda köklü bir değişimi temsil ediyor. Sanal simülasyonların modelleri pahalı laboratuvar deneyleri kadar etkili bir şekilde eğitebileceğini göstererek, CZI, dünya çapındaki araştırmacıların zaman, para ve fiziksel kaynakların geleneksel kısıtlamaları olmadan çalışmalarını hızlandırmalarının yolunu açtı.
CZI, rBio'yu Sanal Hücre Platformu aracılığıyla ücretsiz olarak kullanıma sunmaya hazırlanırken, kuruluş, kanser tespiti için GREmLN gibi modeller ve görüntüleme teknolojileri üzerindeki devam eden çalışmalarla biyolojik yapay zeka yeteneklerini genişletmeye devam ediyor. Yumuşak doğrulama yaklaşımının başarısı, diğer kuruluşların bilimsel uygulamalar için yapay zekayı eğitme biçimini etkileyebilir ve bu sayede bilimsel titizliği korurken deneysel verilere olan bağımlılığı azaltabilir.
Yüzyılın sonuna kadar tüm hastalıkları tedavi etme gibi cüretkâr bir hedefle yola çıkan bir kuruluş için rBio, tıp araştırmacılarının uzun zamandır aklından geçen bir şey sunuyor: Biyolojinin en zor sorularını sorup, bir cümle yazmak için gereken sürede bilimsel temellere dayanan cevaplar almanın bir yolu. İlerlemenin geleneksel olarak on yıllarla ölçüldüğü bir alanda, bu tür bir hız, nesilleri tanımlayan hastalıklar ile uzak anılara dönüşen hastalıklar arasındaki farkı yaratabilir.
Patronunuzu etkilemek istiyorsanız, VB Daily size yardımcı olabilir. Şirketlerin üretken yapay zeka ile ilgili neler yaptığına dair, mevzuat değişikliklerinden pratik uygulamalara kadar her şeyi size aktarıyoruz, böylece maksimum yatırım getirisi için fikirlerinizi paylaşabilirsiniz.
Gizlilik Politikamızı okuyun
Abone olduğunuz için teşekkür ederiz. Daha fazla VB bültenine buradan ulaşabilirsiniz.
Bir hata oluştu.

venturebeat