Kaynak: Zhiyang Creative Talk
Bu makale hakkında 4500 kelime , Okumanız tavsiye edilir 9 dakika
Bu makale, "Yeni Koronavirüs Veri Kaynakları ve Küresel Araştırma Projeleri" dahil olmak üzere bazı veri türlerini, veri kaynaklarını, veritabanlarını ve platformları sizin için derledi.
Etiket: Veri Toplama
Şu anda, yeni taç virüsü küresel olarak yayıldı. Çin'deki salgın etkili bir şekilde kontrol altına alınmasına rağmen, İtalya, Güney Kore, İran, Japonya ve ABD gibi ülkeler yavaş yavaş "düştü". Dünya çapında doğrulanmış yeni koroner pnömoni vakalarının sayısı bir milyonu aştı. Tehditkar salgın karşısında, araştırmacılar, virüsü ve bununla ilgili sosyal sorunları anlamaya yardımcı olmak için araştırma uzmanlıklarını kullanmak istiyor. Peki verileri nerede bulacağız?
Bu makale, Harvard Üniversitesi Coğrafi Veri Merkezi, Çin Veri Araştırma Enstitüsü, Wuhan Üniversitesi Sosyal Coğrafi Bilgi İşlem Merkezi ve Araştırma Yöntemleri ve Veri Bilimi Laboratuvarı tarafından ortaklaşa yürütülen "Yeni Koronavirüs Veri Kaynakları ve Küresel Araştırma Projeleri" ni özetlemekte ve sıralıyor. Veri türü, veri kaynağı, veritabanı ve platform referans için.
esas olarak içerir Harita verileri (il, belediye ve ilçe düzeyi), nüfus sayımı verileri (nüfus ve ekonomik nüfus sayımı), il, belediye ve ilçe istatistikleri ve diğer veriler. Harita verileri sabit değildir Ulusal veya il haritaları çok az değişebilir, ancak belediye veya ilçe / ilçe düzeyindeki mekansal haritalar çok farklıdır ve zamanla değişecektir. Bu nedenle, araştırma için temel harita seçimi çok önemlidir.
Ulusal İstatistik Bürosu: Daha resmi istatistiksel raporlar sağlamak için çeşitli iller, şehirler ve bölgelerin istatistik web sitelerine bağlantı verin.
Ulusal veriler: Ulusal İstatistik Bürosu, son derece yetkili olan ülkemizin çeşitli alanlarındaki makroekonomik durumu yayınlamak için bir web sitesi kurdu.
China Data Online:
https://www.china-data-online.com/
Temelde yeni koronavirüs salgını dahil Gerçek zamanlı büyük veri, ilgili veritabanları, platformlar .
Baidu Salgını Hakkında Gerçek Zamanlı Büyük Veri Raporu
https://voice.baidu.com/act/newpneumonia/newpneumonia
Netease pnömoni salgını gerçek zamanlı dinamik yayın
https://wp.m.163.com/163/page/news/virus_report/index.html?_nw_=1_anw_=1
Tencent salgınının gerçek zamanlı takibi
https://news.qq.com/zt2020/page/feiyan.htm?from=timelineisappinstalled=0#/global
Sina salgınının gerçek zamanlı dinamik takibi
https://news.sina.cn/zt_d/yiqing0121?cre=tianyimod=wnewsloc=3r=-1rfunc=97tj=cxvertical_wap_wnewstr=73vt=4pos=3
COVID-19 açık araştırma veri seti, dünyanın her yerinden koronavirüs (aile) hakkında 29.000'den fazla ilgili akademik makale içermektedir ve bunlar, yeni taç pnömoni salgınıyla başa çıkmak için esas olarak tıp ve NLP (doğal dil işleme) ile ilgili alanlardaki araştırmalar için kullanılacak. Bu veri setinde 13.000'den fazla makine tarafından okunabilen makale bulunmaktadır. Araştırmacılar, yeni koronavirüsle daha verimli bir şekilde savaşmanın yollarını bulmak için metin madenciliği ve yorumlamayı hızlandırmak için makine öğrenimini kullanabilir.
https://pages.semanticscholar.org/coronavirus-research
Çin Bilimler Akademisi tarafından sürdürülen bu belge, salgın takibi, en son gelişmeler, araştırma ilerlemesi ve saha konuları dahil olmak üzere belgesel bilgiler sağlar. "Araştırma İlerlemesi" bölümü, bir zaman çizelgesinde araştırmacılar tarafından yürütülen araştırma faaliyetlerini ve ilerlemeyi gösterir. İçerik sürekli güncellenir ve tam metin kayıttan sonra indirilebilir.
Ulusal Biyoinformatik Merkezi (CNCB) / Pekin Genomik Enstitüsü (BIG), Çin Bilimler Akademisi (BIG) / Ulusal Genom Bilimi Veri Merkezi (NGDC) / Yaşam ve Sağlık Büyük Veri Merkezi (BIGD) tarafından korunmaktadır, viral genom dizisi salım dinamikleri ve viral genom mutasyon verileri dahil Analiz, literatür araştırması vb.
https://bigd.big.ac.cn/ncov#contact
Ulusal Mikrobiyoloji Bilim Veri Merkezi / Yeni Koronavirüs Ulusal Bilim ve Teknoloji Kaynak Hizmet Sistemi tarafından korunur ve virüs suşu bilgileri, virüs elektron mikroskobu fotoğrafları, nükleik asit tespit primerleri ve prob dizileri, virüs genom bilgileri, bilimsel bilgiler vb. İçerir.
Çin Bilimler Akademisi Wuhan Dokümantasyon ve Bilgi Merkezi ve Çin Bilimler Akademisi Dokümantasyon ve Bilgi Merkezi tarafından sağlanmaktadır. Web sitesi, yurtiçi ve yurtdışında "2019-nCoV" ile ilgili önemli bilimsel araştırma gelişmelerini toplar, önemli bilimsel araştırma ilerlemelerini çıkarır ve günde iki kez ilgili bilimsel araştırma ilerlemesini sunar. Çıkarılan içerik günlük bir bülten oluşturur ve bu haftanın ilgili içeriği virüs kaynağı, salgın tahmini, Virüs tespiti ve hastalık teşhisi, ilaç araştırma ve geliştirme, mekanizma araştırması, politikalar ve düzenlemeler, haftalık bilimsel araştırma dinamik sınıflandırma derlemesi olarak sınıflandırılır.
Çin Patent Bilgi Merkezi / Ulusal Fikri Mülkiyet Ofisi Patent İnceleme İşbirliği Pekin Merkezi tarafından sürdürülen veriler, yeni koroner pnömoni ilaçlarının tedavisini, önleyici ilaçları, virüs testini, tıbbi ekipmanı, koruyucu ürünleri, çevresel dezenfeksiyonu, atık arıtmayı, atık su arıtmayı, yapay zekayı kapsar. Ve büyük veri uygulamaları ve diğer alanlar.
Çin Hastalık Kontrol ve Önleme Merkezi tarafından sürdürülmektedir. Salgın durum, teknik planlar, literatür raporları ve DSÖ bilgileri gibi sütunlardan oluşmakta olup, yurt içi salgın değişiklikleri ve Dünya Sağlık Örgütü'nün son önlemlerini takip edebilmektedir.
Bilim ve Teknoloji Bakanlığı, Ulusal Sağlık Komisyonu, Çin Bilim ve Teknoloji Derneği ve Çin Tabipleri Birliği tarafından ortaklaşa kurulmuştur. Çin Tabipleri Birliği dergileri ve diğer yerel biyomedikal ve sağlık dergileri tarafından yayınlanan ilgili akademik içeriği ve kamu akademik kaynaklarını sürekli olarak güncelleyin ve özetleyin ve yabancı yeni koroner pnömoniyle ilgili mükemmel bilimsel araştırma sonuçlarını teşvik edin.
Ulusal Bilim ve Teknoloji Kütüphanesi (NSTL) tarafından kurulmuştur. Bu tematik veri tabanı, yabancı dillerdeki koronavirüs araştırmalarıyla ilgili 3,5 milyondan fazla bilimsel ve teknolojik belge içerir ve belge türleri, yabancı dergi makalelerini, bilimsel kitapları, bilimsel ve teknolojik raporları, patentleri, standartları vb. Kapsar. Tematik bilgi portalı, Dünya Sağlık Örgütü (WHO), Çin Ulusal Sağlık Komisyonu, Çin Hastalık Kontrol ve Önleme Merkezi ve ABD Hastalık Kontrol ve Önleme Merkezleri tarafından yayınlanan önleme ve kontrol yönergelerini zamanında takip etti ve bildirdi. New England Journal of Medicine gibi 30'dan fazla yetkili derginin en son araştırma sonuçları. İçerik yalnızca Wuhan yeni koronavirüs enfeksiyonunu değil, aynı zamanda SARS ve MERS gibi ilgili belgeleri de içerir. Yalnızca patojenik biyoloji ve epidemiyoloji gibi temel araştırmaları değil, aynı zamanda önemli klinik tanı ve tedavi, ilaç tedavisi, muayene ve test ve aşı araştırması içeriğini de içerir.
https://www.nstl.gov.cn/service/coronaviridae/index.html
Dünyanın en büyük akademik yayın kuruluşlarından biri olan Springer Nature, koronavirüs araştırmalarıyla en alakalı en son makaleleri dergilerinden derledi ve ilgili inceleme makaleleri ve kitaplarla birlikte özel web sayfasında özetledi. Ücretsiz olarak kullanılabilir.
https://www.elsevier.com/connect/coronavirus-information-center
Yeni koronavirüs ile ilgili araştırma sürecinde nüfus göçü verileri olmadan virüsten bahsetmek bizim için zor. Burada bahsedilen nüfus göçü verileri temel olarak iki kaynağı içerir: Birincisi, tarayıcı teknolojisi aracılığıyla elde edilebilen Baidu Migrations tarafından sağlanan günlük nüfus göçü verileridir. Aşağıdaki iki resim, Wuhan'ın 23 Ocak 2020'deki yüzen nüfusunun haritasıdır. Solda diğer şehirlerden Wuhan'a akış ve sağda Wuhan'dan diğer şehirlere akış var.
Veri kaynağı: Baidu Migration
https://qianxi.baidu.com
Bununla birlikte, Baidu'nun göç verileri bize yalnızca nüfus akışının yönünü söyler, ancak her bir akış yönünün boyutunu açıklamaz. Bu, Ulusal İstatistik Bürosu tarafından yayınlanan yüzen nüfus verileri olan başka bir veri kaynağıyla birlikte akışın boyutunu belirlememizi gerektirir.
Bu, yüzen nüfusun akademik tanımına daha yakındır ve Baidu'nun nüfus hareketi verileri, daha çok nüfus hareketi akışındaki değişikliklerin bir kaydı gibidir. Aşağıdaki şekil, Ulusal İstatistik Bürosu tarafından yayınlanan yüzen nüfus verilerinin sağladığı yüzen nüfus verilerini göstermektedir:
Veri kaynağı: China Data Online
https://china-data-online.com
Sağlık tesisleri verileri temel olarak Gaode Haritalarından POI (Bilgi Noktası) verilerini ve Ulusal İstatistik Bürosu tarafından sağlanan ekonomik nüfus sayım verilerini içerir.
Örnek olarak Wuhan'daki hastane verilerini alın. Gaode haritasını tarayarak (örneğin, enlem ve boylamı tarayarak), Wuhan'daki hastane verilerini Excel'e entegre edebilir ve ardından bu Excel tablosundaki bilgileri önceki temel verilerle birleştirebiliriz. Daha değerli harita verileri.
Veri kaynakları:
https://lbs.amap.com
Hastane veri tarayıcısı süreci şunları içerir: AutoNavi POI verilerinin HTTP arayüzünü elde edin, POI türünü ve konumun idari bölüm kapsamını belirleyin - > JSON formatındaki verileri ayrıştırın ve etiketi POI verileri olarak pois içinde saklayın. Parametreler arasında hastanenin adı, POI türü, anlamsal adres, WGS84 koordinat sistemindeki koordinatlar ve idari bölüm birimi bulunur. > Ulusal sağlık kurumlarının sınıflandırma standartları ile Gaode Haritasının POI sınıflandırma standartları arasındaki haritalama ilişkisini kurun > Hastane türünü eşleştirin ve il idari birimine göre Excel formatlı bir dosya olarak saklayın > İllerin, şehirlerin, ilçelerin ve ilçelerin idari bölüm haritasına göre eşleştirin ve birleştirin.
Hastane verileri de ekonomik sayıma dahil edilmiştir. AutoNavi Map verileri bize hastanenin ne zaman kurulduğunu, hastanenin sahiplik yapısını (özel vs kamu) ve belirli bir bölgedeki hastanelerin sayısını farklı yıllarda söyleyemez, ancak ekonomik nüfus sayımı verileri bu eksik verileri telafi edebilir (aşağıda gösterildiği gibi):
Veri kaynakları:
https://china-data-online.com
Ekonomik sayımdaki hastane verileri, AutoNavi harita verileriyle eşleştirilebilir ve ayrıca araştırmamızla ilgili mekansal harita verileri oluşturmak için temel verilerle birleştirilebilir.
Veri kaynakları:
https://lbs.amap.com
Hastane verilerine ek olarak, tıbbi ekipman ve imalat da salgın önleme ve kontrol için çok önemlidir. Bu bilgi ayrıca ekonomik nüfus sayımından da elde edilebilir.
Veri kaynakları:
https://china-data-online.com
Ek olarak, kullanılabilecek başka sağlıkla ilgili verilerimiz var. Örneğin, aşağıdaki şekildeki yıllık sağlık istatistikleri (Çince verileri çevrimiçi olarak mevcuttur). Yıllık istatistikler, Gaode haritasındaki eksik bilgileri tamamlayabilecek şekilde ulusal, il ve belediye bölgelerindeki hastane sayısı, ayakta tedavi gören hasta sayısı, yatak sayısı, sağlık personeli sayısı ve diğer sağlık istatistiklerini detaylandırmaktadır.
Veri kaynakları:
Diğer bir örnek, China Spatial Information System tarafından sağlanan sağlık verileri olan China Geo-Explorer'dır. Bu web sitesi platformu, çeşitli çalışmalar için gerekli çizelgeleri, haritaları ve raporları oluşturmak için istatistiksel verileri, nüfus sayım verilerini ve CBS verilerini entegre eder.
Veri kaynakları:
Bu bölüm, ağırlıklı olarak Weibo ve Twitter gibi sosyal medyayı içeren sosyal kamuoyunu yansıtıyor. Bu sosyal medya ana bilgi kaynakları olduğu için, salgın tahmini ve kamuoyu yönelimi gibi araştırma sıcak noktaları üzerinde yönlendirici bir etkiye sahiptir.
Çin Veri Araştırma Enstitüsü:
Harvard Dataverse:
Baidu Endeksi: Baidu / Baidu netizen davranış verileri altında, sorgu talep grafiklerini destekleyen bir veri paylaşım platformu
Micro Index: Sina Weibo altında / Weibo kamuoyunu veya hesap geliştirme trendini yansıtan bir veri analiz aracı
https://data.weibo.com/
Sogou Index: Sogou altında bir veri paylaşım platformu / Sogou kullanıcı davranışına dayalı ve aynı zamanda WeChat arama popülerliğini destekliyor
Temelde çeşitli alt endüstrileri ve İnternet, e-ticaret, eğlence, otomobiller, emlak, mobil terminaller, yatırım endüstrileri vb. Dahil olmak üzere diğer veri kaynaklarını içerir. Salgının çeşitli endüstriler üzerindeki etkisi çok geniştir ve etkinin kapsamı ve gelecekteki eğilimler daha fazla çalışmaya değerdir.
Tencent Big Data: Tencent'in yan kuruluşu / Tencent ile yakından ilgili araştırma raporları yayınlıyor ve genellikle bazı ilginç konular ortaya çıkıyor
https://bigdata.qq.com//reports?page=1
IResearch: iResearch / support altında, daha yeni veri raporlarını görüntüleme, esas olarak çevrimiçi medya, e-ticaret ve çevrimiçi oyunlar gibi yeni ekonomik alanları araştırıyor.
IiMedia: iiMedia'nın iResearch ile hiçbir ilgisi yoktur, iiMedia tarafından yayınlanan araştırma raporları çoğunlukla mobil İnternet yönündedir
Analysys Think Tank: Analysys International piyasaya sürüldü / yeni medyanın ekonomik yönü hakkında genel olarak sektör bilgi raporlarını başlattı
https://www.analysys.cn/article#analysis
Çin İnternet Bilgileri Araştırma Merkezi: Ulusal yetkili makamın onayı ile kurulan ve genellikle bazı değerli İnternet bilgileri raporları yayınlayan bir yönetim ve hizmet kuruluşu
199IT: Çok sayıda İnternet veri raporu tutar ve navigasyon web sitesi, verilerle ilgili çok sayıda web sitesi bağlantısı toplar
Ali Index: Ali altında bir veri analiz platformu / Taobao platformunun piyasa eğilimlerini yansıtan.
https://index.1688.com/
Alibaba Araştırma Enstitüsü: Alibaba's /, e-ticaret ve diğer yönlerdeki eğilimleri, çoğunlukla Alibaba ile ilgili olarak inceleyen veri raporları yayınlamaktadır.
CBNDdata: Alibaba'nın ticari veri tabanına dayalı olarak endüstriyel ekonomik analiz raporları çıktı
CBO Çin Gişe Ofisi: Yerel gişe verilerine, gişe sıralaması istatistiklerine, katılım ve diğer bilgilere dayanmaktadır.
IQiyi Index: iQiyi altında / iQiyi oynatma verilerine dayanarak, video oynatma trendleri ve video izleyici portreleri gibi bilgileri görüntüler.
DataEye: Yerel oyun endüstrisi verilerine dayalı olarak, çok açılı bir endüstri anket raporu yazılır ve yayınlanır
https://www.dataeye.com/report
Otomatik Dizin: Yerel otomobil satış pazarını yansıtan ve otomobil alıcıları veya otomobil uygulayıcıları için bir referans sağlayan bir veri endeksi.
AutoNavi Haritası: İç trafik koşullarının gerçek zamanlı görüntülenmesini destekler ve AutoNavi periyodik olarak bir dizi veri raporu sağlar.
https://report.amap.com/detail.do?city=110000
Fang Tianxia: Web sitesi verileri, Çin Endeksi Araştırma Enstitüsü ve CREIS Orta Endeksi verilerinden geliyor ve yerel emlak verilerini gösteriyor
https://fdc.fang.com/index/
Mobil Gözlemevi: Mobil cihaz kullanıcılarının çalışma davranışlarına bağlı olarak uygulamalar, resmi hesap sıralamaları vb. Sağlar ve ayrıca çok sayıda veri raporu yayınlar.
IResearch APP Index: Aylık bağımsız cihazlar, günlük ortalama bağımsız cihazlar ve aylık toplam etkin süre gibi çeşitli açılardan mobil terminal verilerinin görüntülenmesini destekleyin.
https://index.iresearch.com.cn/new/#/
Yatırım Araştırma Enstitüsü: Web sitesi, yüksek bir frekansı korur ve yatırım alanında kullanıcılara analiz raporları gönderir.
https://www.chinaventure.com.cn/report/list.html
Yukarıda bahsedilen yeni taçla ilgili veritabanları, platformlar ve veri kaynaklarının tümü, diğer verilerle etkili bir şekilde entegre edilebilen halka açık verilerden gelir ve birçok anlamlı bilimsel araştırma projesi başlatılabilir. Küresel anti-salgın cephenin zorlukların üstesinden gelmesine yardımcı olmak için akademik ve bilimsel araştırmaları kullanan meslektaşlarınızı dört gözle bekliyorum!
Bilginin bir kısmı, yalnızca öğrenme ve iletişim için "Brown School" dan geliyor
Editör: Yu Tengkai
Redaksiyon: Lin Yilin
-Bitiş-
Tsinghua-Qingdao Veri Bilimi Enstitüsü'nün resmi WeChat kamu platformunu takip edin " AI Veri Pastası "Ve kız kardeş numarası" Veri Pastası THU "Daha fazla ders avantajı ve kaliteli içerik elde edin.