BGI BGI Online'ın başkanı Jin Xin bir konferans verecek: gen büyük verisinin kökeni, mevcut durumu ve geleceği | Zor Yaratılış Açık Kursu

Ultra-Moore yasasının eğilimi ile gen dizilemesinin fiyatı düştüğü için, genomik araştırmalarında, klinik teşhislerinde ve çeşitli hastalıkların kişiselleştirilmiş tedavisinde yaygın olarak kullanılmaktadır. Bu bağlamda, sektördeki uzmanlar, bugün gen sıralama endüstrisinin karşı karşıya olduğu en büyük zorluğun artık gen sıralama teknolojisi değil, büyük miktarda verinin işlenmesi ve devasa verilerden klinik rehberlik elde etme olduğuna inanıyor. Leifeng.com'a göre, biyoinformatik analiz hizmeti şu anda sektördeki en potansiyel ve karlı bağlantı olarak kabul ediliyor, ancak Çin'de hala emekleme aşamasında.

Öyleyse, genetik veriler ile diğer veriler arasındaki benzerlikler ve farklılıklar nelerdir? Genetik verilerin işlenmesindeki zorluklar ve zorluklar nelerdir? Genetik verilerin geleceği nedir? Bu açık sınıfta, Leifeng.com AI Nuggets sütunu, BGI Gene Ar-Ge Merkezi müdür yardımcısı Jin Xin'i "Gene Büyük Veri-Kökeni, Mevcut Durum ve Geleceğin Kısa Tarihi" üzerine bir açılış konuşması yapmaya davet etti.

Misafir tanıtımı:

BGI Ar-Ge Merkezi müdür yardımcısı ve BGI Online platformunun başkanı Jin Xin, BGI Gene'nin genç bir bilim insanıdır.

Jinxin, Uluslararası Bin İnsan Genom Projesi, Çin-Danimarka Diyabet Genom Projesi, İnsan Pan Genom Atlası Projesi, Yayla Genom Projesi ve Otizm Genom Projesi dahil olmak üzere bir dizi büyük bilimsel araştırma projesine katıldı. 2009 gibi erken bir tarihte, Jin Xin, bir okul öğrencisi olarak "Doğa Biyoteknolojisi" alt dergisinde "İnsan Pan-Genom Dizisi Haritası Oluşturmak" ı yayınladı ve ilk kez "İnsan Pan-Genomu" kavramını önerdi.

Açık sınıf videosu:

(Not: Bu açık sınıfta, Dr. Jin Xin ilginç vakalar gösterdi ve netizenlerden gelen birçok harika soruyu yanıtladı, bu nedenle önce videoyu izlemeniz önerilir.)

Aşağıda, Dr. Jin Xin'in konuşmasının içeriği yer almaktadır. Lei Feng.com orijinal niyetini değiştirmedi:

Ben BGI Gene'den Jinxin. Şu anda BGI'nin Ar-Ge Merkezi'nin müdür yardımcısıyım ve BGI Online ve büyük veri projelerinden sorumlu kişiyim. Bugün sizinle paylaşmak istediğim konu genetik verilerin kökeni, kalıtımı ve evrimi.

Hepimiz genlerin Tanrı'nın dili olduğunu söylüyoruz.Genleri söylemeden önce size bir taş stel göstereceğim.Bu taş stel Rosetta Taşı olarak adlandırılır.2.200 yıldan fazla bir süredir korunmuştur.MÖ 197 yılında yapılmış ve üzerine oyulmuştur. Birden çok dil: Yunanca karakterler, Mısır hiyeroglifleri, ayrıca Mısır halk karakterleri ve Roma karakterleri. Aslında stel, bilinen en uzun bilgi taşıyıcısıdır.

Vücudumuzda çok sayıda hücre vardır ve her hücrenin tam bir genomu vardır.Genom hakkında bilgi taşıyıcısı, baz dediğimiz ATCG'nin dört temel temel birimidir. Yeryüzünde yaşam olduğu için, bilinen yeryüzü canlılarının çoğu, hayatımızın tüm sırlarını DNA biçiminde taşıdılar, ancak sözde taşıma ve aktarım sadece bir kayıt değil, daha çok sürekli çoğaltma yoluyla. Bunu aktarın ve bulaşma süreci çok kesin ve eksiksiz bir üreme süreci değildir, bu da tüm gezegendeki türleri bugün binlerce ve renkli kılar.

Genlerin kökeni

Yıllar önce insanlar Gene Kitabını okuma çabalarına başladı.

20. yüzyılda insanlığın üç büyük bilimsel yeniliği vardı: 1945'teki Manhattan atom bombası projesi, 1969'daki Apollo aya iniş projesi ve 2000 civarında tamamlanan insan genom projesi.

Başından beri İnsan Genomu Projesi'nin üyesiydik. O zamanlar toplam 6 ülke katıldı. Amerika Birleşik Devletleri, İngiltere, Fransa, Almanya, Japonya ve Çin. İnsan Genomu Projesi'ne katılan tek gelişmekte olan ülke Çin'di. 9 Eylül 1999'da, İnsan Genomu Projesi'nin Çin bölümünün% 1'ini tamamlamak için BGI kuruldu. O zamanlar insan genetik verilerini okumak için, tıpkı bir harita navigasyon koordinat sistemi gibi, tam bir insan genetik referans dizisi yapmak gerekiyordu ki bu aslında çok zordu. 6 ülkede yüzbinlerce bilim insanı ilk insan genom dizilimini tamamlamak için 13 yıl ve 3 milyar ABD doları harcadı, bu süreç aynı zamanda birçok ilgili disiplinin, teknolojinin ve endüstrinin gelişmesini de beraberinde getirdi. Size söylemek istediğim şey, 2000 yılından önce bir kişinin genetik verilerini okumanın on yıldan fazla süreceği.

Bugün bir veri çağı, İnternet çağı, zeka çağı ve tüm bunların özü bugün bahsettiğimiz verilerdir.

Diğer verilerle karşılaştırıldığında, genetik verilerin üretilmesinde birçok özel yer vardır.Genetik verilerin elde edilmesi özel bir ekipman - bir gen sıralayıcı gerektirir. Ekim 2015'te, BGI tarafından geliştirilen, Çin'in bağımsız fikri mülkiyet haklarına sahip ilk yerli yapım gen sıralayıcısı çıktı.

Aslında, son birkaç on yılda, birçok yüksek hassasiyetli tıbbi ekipman ve diğer büyük ölçekli ekipman gibi, gen sıralayıcılar aslında çoğunlukla ithalata dayanıyordu. Bugün, dünyanın iki ülkesinden yalnızca üç şirket, klinik düzeyde gen sıralayıcıları seri üretebilmektedir.İki ülke ABD ve Çin'dir ve üç şirket Illumina, Thermo Fisher ve Çin'in BGI'sidir.

Pek çok kişi Moore Yasasına aşinadır.Fiyat aynı kaldığında, bir entegre devredeki transistör sayısı 18 ayda iki katına çıkar. 2007 civarında, gen dizileme teknolojisindeki büyük atılımlar, gen dizileme maliyetinin hızla düşmesine, hatta Moore Yasasının eğimini aşmasına neden oldu.

Bu grafik Ocak 2011 itibariyle ve şimdi, bu çizgi temelde eksenin dibiyle aynı seviyede, yani bir kişinin genetik verilerini okumanın maliyeti bin dolardan az. Teknolojinin daha da gelişmesi ve üretim ölçeğinin daha da artmasıyla birlikte, onu daha ucuza yapma fırsatına sahip olduğumuza inanıyoruz.

Genetik veriler diğer birçok veriden çok farklıdır: birim verilerini edinmenin maliyeti hala yüksektir . Taobao'nun e-ticaret verileri, Baidu'nun arama verileri ve Didi taksi'nin seyahat verileri vardır.Bunlar herkesin kullandığı işlemle ilişkilidir.Bu verilerin marjinal maliyetinin neredeyse sıfır olduğunu ancak genetik verilerin üretilmesinin özel işlemler gerektirdiğini düşünebiliriz. , Kan veya tükürük çekerek, ondan DNA çıkararak ve özel gen dizileme ekipmanından geçerek nihayet gen verileri elde edilebilir. Bu nedenle genetik veriye herkes tarafından tıpkı diğer veriler gibi erişilecek ve herkesin sağlığına hizmet edecekse, elde etme maliyeti daha da azaltılmalı ve elde etme hızı daha da hızlandırılmalıdır.

2003 yılında ilk insan genom dizilimini tamamladık. 2006'dan bu yana, DNA çift sarmal yapısının keşfi Watson da dahil olmak üzere bazı insanlar kendi tam genom verilerini elde ettiler. 2008 yılı civarında ilk kez Asyalıların genetik veri haritası elde edildi.Daha sonra Japon, Kore, Afrika vb. Genetik verileri de sürekli olarak çözüldü, ancak o zamanlar kendi kişisel genom verilerine sahip çok az insan vardı. Başlangıçta, birçok büyük ölçekli bilimsel araştırma projesi başlatıldı ve dünyadaki birçok insanın kendi genetik verileri var. Kendi genetik verilerine sahip milyonlarca insanın olduğu ihtiyatlı bir şekilde tahmin ediliyor.Bence bu çok heyecan verici çünkü eskiden genetik veriler hakkında hiçbir şey bilmiyorduk, ancak son on yıldan beri genetik veriler Çok hızlı elde edilir ve biriktirilir.

miras

İngiliz kraliyet ailesinden biri bir zamanlar çok ciddi bir genetik hastalık olan gen hemofili taşıyordu.Bu gendeki mutasyonlar, kanın pıhtılaşma yeteneklerinde engellere neden olabilir.Aynı zamanda, kraliyet ailesi kanın saflığına dikkat ediyor, bu nedenle hemofili bu ailede. Nesilden nesile aktarılan bu kuşak İngiliz kraliyet ailelerinde temelde hiç kimse hemofili geninin taşıyıcısı değildir, ancak hemofili genleri Avrupa'daki diğer birçok kraliyet ailesinde hala mevcuttur.Bu, nesilden nesile aktarılan genetik verilerdir. Kişinin kendi genlerini aktarması aslında her bireyin ve her türün en temel içgüdüsüdür Genler, hastalığa neden olan genler de dahil olmak üzere tüm çeşitli özelliklerimizi aktarır.

Kalıtım kuşaktan kuşağa aktarılır, ancak aynı zamanda dokuz çocuğu olan bir anne de vardır, dokuz çocuğu farklıdır.Yaşam geçiş sürecinde mutasyon olasılığı vardır ve bu mutasyonun getirdiği riskler aslında herkesin karşılaşabileceği bir durumdur. Herkes onunla karşılaşabilir.

Daha önce, seçilen otizm örneklerinin her iki ebeveynin de normal olduğu, ancak çocuklarının otizm olduğu açıkça belirlendiği bir otizm araştırma projesi yaptık.Genetik testler, her iki ebeveynin de garip genlere sahip olmadığını ortaya koydu. Bir çocukta ciddi bir hastalığın nedeni ile ilgili olarak, birçok uzman daha sonra, her iki ebeveynin de genlerini yavrularına aktardığında, yavruların genlerinin daha çok babadan geldiğini söyledi. Kadın ve erkeğin üreme stratejileri çok farklıdır Bir kadının hayatındaki yumurta sayısı belirlenir, menopoza kadar her ay yaklaşık bir yumurta boşaltılır, ancak erkekler doğurgan olduğu için çok sayıda spermi çoğaltarak miktar bazında kazanırlar. Sürekli olarak on binlerce hatta yüz milyonlarca sperm üretilmektedir ve sperm replikasyonu sürecinde yeni mutasyonların olasılığı yumurtalarınkinden çok daha fazladır.

Bir zamanlar bir gözlem yaptık. Çok sayıda aile bulduk. Babanın yaşını bağımsız bir değişken olarak aldık ve babanın yaşı ile çocuğun genlerindeki yeni mutasyonların sayısı arasındaki ilişkiyi gözlemledik ve bariz bir pozitif korelasyon bulduk. O zamanki tahminlere göre, Babanın yaşı her bir yıl arttığında, çocuk yaklaşık bir yeni mutasyon ekleyebilir. İnsan genomunda çok sayıda gen vardır.Her yerde gen mutasyonları meydana gelebilir Çoğu lokasyondaki küçük mutasyonlar herhangi bir soruna yol açmayabilir.Ancak maalesef mutasyon çok önemli bir yerde meydana gelirse çocuk hasta olur. risk.

Öyleyse hayat verileri neden böyle? Genetik verileri aktarmak için, daha doğru şekilde çoğaltmak ve daha az hata üretmek daha iyi olmaz mıydı?

Tüm tür açısından konuşursak, düşüncelerimiz oldukça farklı olabilir. Yeni mutasyonlar bir dereceye kadar türlerin genetik çeşitliliğini artırıyor. Genetik çeşitlilik tek hale gelirse, türlerin gelişmeye devam etmesi daha zor hale gelecektir.

Çok basit bir örnek vermek gerekirse, Guangdong, Guangxi ve Hainan eyaletleri nispeten yüksek Akdeniz gen taşıma oranlarına sahiptir.Bu bir nedenden ötürü, bu insan yaşamı sırasında çevre ile bir uzlaşmadır. Talasemi geni ilk olarak Akdeniz kıyılarında keşfedilmiştir. Ve talasemi en çok bu boyutta meydana gelir, nedeni budur.Uzun zaman önce, bu boyutun doğal ve meteorolojik ortamında sıtmanın görülme sıklığı yüksekti, hastalık çok ciddi hale geldiğinde ölüme yol açacaktı. İnsanların sıtmaya karşı belli bir direnci vardır.İnsanların sıtmayı kontrol etmenin başka bir yolu olmadığında, bu genin taşıyıcılarının hayatta kalma avantajı vardır.Sonunda talasemiye neden olan genler bu bölgelerde yayılmıştır.

Bugünlerde bize sık sık soruluyor, bir çeşit kötü gen taşıyor muyuz? Ama iyi genler ve kötü genler nelerdir? Temel olarak konuşursak, iyi ya da kötü gen yoktur, sadece çeşitlilik vardır. Bu çeşitlilik, bazı insanların genetik mutasyonlar nedeniyle bizden farklı görünmesine neden oluyor, ancak bu aslında çevresel, meteorolojik ve jeolojik koşullardaki büyük ölçekli değişiklikler veya tüm gıda yapısındaki dramatik değişiklikler gibi insan hayatta kalması için yeni bir olasılık sunuyor. Bekle, eğer insan genleri şu anda çok benzer ise, o zaman bir tür olarak insanın hayatta kalma olasılığı büyük ölçüde azalacak.

Genetik teknolojinin geleceği

Peki bilim ve teknoloji ciddi genetik hastalıklar, tümörler, bulaşıcı hastalıklar vb. İçin ne yapabilir?

Doğurganlık açısından bakıldığında, talasemi gibi genetik hastalıklar bebek doğmadan önce özellikle yüksek insidanslı bölgelerde incelenebilir, genetik testler gebelik öncesinde bile yapılabilir ve buna uygun hazırlıklar yapılıp rehberlik alınabilir. Muayene sonucu her iki ebeveynin de aynı genetik hastalığa neden olan genleri taşıdığı ise, buna karşılık gelen müdahaleler, örneğin embriyo implantasyonu yapılabilir.Patojenik mutasyonu taşımayan embriyolar veya hastalığa neden olmayan gen kopyası implantasyon için seçilir. , Bebek kesinlikle sağlıklı. Kısırlık sorunu da var: Kısırlığın bir kısmı alışkanlıktan kaynaklanan düşük nedeniyledir ve çoğu genetik testlerle tespit edilip önlenebilen genlerle ilgilidir.

Günümüzde en çok yaptığımız şey 21-trizomi sendromunu taramak için non-invazif doğum öncesi kontrollerdir. Gelecekte, her bebeğin doğumda bir genetik testten geçeceğine, genetik verilerini okuyacağına ve bunu hastalıkların önlenmesi ve ilaç tedavisi için kullanacağına inanıyorum.

Bugün hala tümörler gibi birçok başka zorlukla karşı karşıyayız. Tümörler için en önemli şey korunmadır.Orta ve geç evrelerde tümörler tespit edildiğinde tedavi seçenekleri çok sınırlıdır.Erken teşhis edilir, erken taranır ve kişiye özel ilaçlarla desteklenirse hastalık etkili bir şekilde kontrol altına alınabilir ve hatta gelecekte tedavi edilebilir. Artık tümörün çevrenin ve genlerin neden olduğu genetik bir hastalık olduğunu biliyoruz. Genetik test sadece erken tarama anlamına gelmez, aynı zamanda bu teknoloji, tümör hücrelerinin spesifik hedef sekanslarını bulmak ve bu sekansları işlenmiş bağışıklık hücrelerine eklemek için genetik testi gibi ilaç geliştirmede de önemli bir rol oynar. Bu bağışıklık hücresini vücuda enjekte eden bu teknoloji, tümörleri belli ölçüde tedavi edebilmektedir.

SARS'ın hala taze olduğunu hatırlayabilirsiniz SARS hastalarının doku sıvısından ve kanından patojen çıkarmak ve genetik test yapmak patojen tipini belirleyebilir. Günümüzde bunu temelde yapabiliyoruz, en çok bilinen patojen mikroorganizmalar için, sadece ne olduğunu değil, aynı zamanda belirli bir antibiyotiğe dirençli olup olmadığını da bilebiliriz.

Öyleyse, genetik teknoloji ne yapabilir?

Herkes hassas tıptan bahsediyor, ancak hassas tıbbın temeli genetik verilerdir. 2016 yılında, bu üç şirket 1 milyondan fazla insanın kısmi genetik verilerini biriktirdi.Parsiyel genetik veri olarak adlandırılan, belirli genetik bilgileri elde etmek için bazı verileri okumak için gen çipi teknolojisinin kullanılmasıdır.

BGI da çok fazla veri biriktirdi.Nisan 2016 itibariyle, tek başına non-invaziv üretim taraması projesi 1 milyon insanı gerçekleştirdi, ancak verileri tüm genom veri sıralaması yoluyla elde ettik, bu nedenle örnek boyutu benzer olsa da, verilerimiz Büyüklük onlardan çok daha fazla. Şimdiye kadar, BGI'nin veri hacmi en az iki katına çıktı.

2001'den 2015'e kadar, genetik veri üretimi büyük araştırma kurumları tarafından teşvik edildi. 2015'ten sonra, araştırma kurumları ve şirketler birçok genetik test uygulamasına sahip oldular.Araştırma projelerinden ortaklaşa yürütülen araştırma projeleri ve uygulamalara kadar, genetik veri birikiminin hızı bellidir. Hızlanacak.

Ancak genetik verilerin birikmesiyle birlikte, göksel genetik kitabını anlamanın önemi ve zorluğu öne çıkmıştır.

İnsan genomu için pek çok kelime biliyor olabiliriz ve dilbilgisini kabaca anlayabiliriz, ancak yine de cümle bölümlemesini hiç anlamıyoruz, bu nedenle makalenin tamamı hakkında hiçbir şey bilmiyoruz ve genler hakkındaki anlayışımız hala çok erken bir aşamadadır. En basit yaşam, virüsler gibi basit türlerden başlayabiliriz, ancak yine de birçok zorluk var, ancak büyük veri ve yapay zeka / makine öğreniminin onlar için atılımlar getireceğini düşünüyorum.

Genetik veriler diğer verilerden farklıdır, veri elde etmenin maliyeti nispeten yüksektir ve veri miktarı yüksektir. Mevcut teknolojiyi kullanırsanız, genetik verileri doğru okumak istiyorsanız, çok sayıda kopya okumanız ve düzenlemelerini bilmek için birleştirmeniz gerekir.Genellikle 30 kez okumanız gerekir.Tümör araştırmalarında bazen yüzlerce hatta binlerce kez test edilir. Her insanın genetik verisi en az 100G orijinal veriye sahiptir.Tüm Çinlilerin tüm genetik verileri okunursa, nasıl saklanacağı ve bununla nasıl başa çıkılacağı büyük bir problemdir.

Genetik verileri ve nihai performansını biliyoruz Verilerin artmasıyla yapay zeka teknolojisini kullanacak genetik verileri anlamamız mümkün. Bununla birlikte, mevcut bilgi ve verileri işleme becerimizle, genetik verileri anlamak, yorumlamak, özetlemek ve özetlemek çok zordur. Ancak şimdi yapay zeka teknolojisi, giderek daha ucuz veri çıkışı ile birlikte büyük atılımlar yaptığına göre, bu konunun parlak bir geleceği olacağını düşünüyoruz.

Bilimsel keşif, teknolojik buluşu teşvik etti ve teknolojik buluş, endüstriyel gelişmeyi teşvik etti. Üç vites birbiriyle etkileşime giriyor ve bilimsel keşif özüdür. Esasen bilimsel sorunları teknik sorunlara, teknik sorunları ekonomik sorunlara dönüştürmemiz gerekiyor. Musk geçtiğimiz günlerde bilimsel araştırma makalelerinin% 99'unun işe yaramaz olduğunu ve anlamının buna benzer olduğunu söyledi.Bilimsel araştırmalar yalnızca keşfedildi ve doğrulandı ve nihayetinde mühendislik uygulaması gerektirdi.

Huada ne yaptı? Tek bir gen okumasının maliyetini sınıra indirmeyi umuyoruz, bu da herkesin kendi genetik verilerini elde etme olasılığının daha yüksek olduğu ve genetik veriler ile bireyler arasındaki ilişkinin de daha büyük olacağı anlamına geliyor. Aynı zamanda, genetik veri analizinin maliyetini sınıra indirmeyi umarak bulutta - BGI Gene BGI platformunda genetik veri analizi yapıyoruz.Alibaba Cloud ile işbirliği sayesinde, genetik veri analizinin maliyeti 100 yuan'ın altına düşürüldü.

Fizikte ve matematikte pek çok teorem ve formül vardır, ancak biyolojide yoktur.Umarım yaşam verilerinin birikmesi ve analiz tekniklerinin kademeli olarak iyileştirilmesiyle yaşam bilimlerinin de temel bir formülü olabilir.

Kerevit kabukları çevre dostu çantalar yapmak için kullanılır ve bilgisayar görüşü testi uzaktan canlandırmak için kullanılır ... Orijinal 2B şirketi de çok eğlenceli olabilir
önceki
ILLUSION, eğitim kurumlarına ücretsiz "VR Girlfriend" sağlayacağını duyurdu.
Sonraki
Büyük ölçekli anten sisteminde yumuşak karara dayalı MIMO sinyal algılama algoritması
Weibo önümüzdeki on yılda neye güvenecek? 2018 · İnceleme
Karaciğerde yeni "Savaş Tanrısı" mı? Kazananlar ve kaybedenler size 10 arkadaşlık ipucu veriyor
Hisense, ilk üç çeyrekte renkli TV pazarına liderlik etmeye devam ediyor ve lazer ve ULED TV'ler iyi performans gösteriyor
Bu film festivalinde her yıl bir veya iki harika Çin filmi doğar.
MPT serisi mikro yer değiştirme konumlandırma sisteminin tanımlanması ve kontrolü
WeChat Pay "tüm ailenin gücünü vermek" için denize açıldığında, bir saniyeden sonraki yetenek katil olur
Alibaba, Tencent'in tamamen önünde olduğunu iddia ederek 17 yıllık mali raporunu açıkladı; Apple, APP ödül işlevini düzeltmek istiyor, düzenlemeleri ihlal ediyor veya raflardan kaldırılıyor | Lei Fen
"Swan Ödülü" nü kazandı OPPO Find X geleceğin amiral gemisi yeni bir yöne öncülük ediyor
"Nintendo Labo" artık ücretsiz çizim indirme için açıldı
"Xiuchun Knife" serisi, zamanımızın en önemli şeylerine dokundu.
11.11 JD Global Goods Festival, tüm insanlar için indirimli alımlar
To Top