Büyük verinin madenciliği ve uygulaması, özellikle yeni enerji alanında her seviyede gerçekleştirilmektedir. Büyük veri yaygın bir şekilde temel ve stratejik bir kaynak olarak kabul edilmektedir.Gelecekteki "dört modernizasyon" karşısında, büyük veri otomobil endüstrisinin gelişimi için önemli bir destek olacaktır. Veri kalitesi, büyük veri analizini belirleyen önemli bir faktördür.
Yeni Enerji Aracı Ulusal Büyük Veri Birliği, 21 Ağustos'ta 2018 Yıl Ortası Konferansı ve Yeni Enerji Araç Değerlendirme Endeksi Seminerinde "Yeni Enerji Aracı Ulusal Düzenleme Platformu Araç Veri Kalitesi Analiz Raporu" nu yayınladı. Rapor, Ocak-Haziran 2018 arasında, ülke çapında 969.107 bağlı araç olduğunu ve 627461 aracın% 64,75'ini oluşturan hataların olduğunu gösteriyor.Toplam 72 tür hata verisi meydana geldi, araç durumu ve bireysel voltaj / sıcaklık değerlerinde yoğunlaştı. vb. Genel olarak platforma bağlı araçların hata olasılığı görece yüksektir.
Yeni Enerji Araçları Ulusal Büyük Veri Birliği genel sekreter yardımcısı Liu Peng, veri raporunu yorumluyor
Liu Peng, Pekin Teknoloji Enstitüsü Doçenti, Yeni Enerji Araçları Ulusal Büyük Veri Birliği Genel Sekreter Yardımcısı Yanlış verinin, veri analizi sonuçlarını etkileyeceğini ve ayrıca şirketin yeni enerji aracı kilometre doğrulamasını da etkileyeceğini söyledi.
Platforma başarıyla bağlanan araçlar
İşletim veri kalitesi hala endişe verici
Yeni enerji aracı ulusal denetim platformu, bu yılın Şubat ayı başında resmi olarak kullanıma açıldı.Yeni enerjili araç güvenliği denetimi, veri analizi, araç yönetimi ve sübvansiyon muhasebesi için kullanılan bağlı araç sayısı bir milyonu aştı. 13 Ağustos 2018 itibarıyla araç servis platformuna bağlı araç sayısı 1.0476 milyon, 429 kayıtlı araç şirketi ve "platform uygunluk testini" geçen ve "araç uygunluk testini" geçen 384 araç şirketi oldu. 5388 modeli var.
Kurumsal platform ulusal platforma erişmek istiyorsa, araç statik veri erişimi ve dinamik veri erişim denetiminden geçmesi gerekir. Şu anda, bu platform toplam 231 TB geçerli veri depolamakta ve her gün yaklaşık 1 TB veri eklenmektedir. Bunlar arasında, gerçek zamanlı verilerin manuel olarak incelenmesini geçen araç sayısı% 73,18 ile 766.000; gerçek zamanlı verilerde incelenmeyen ve başarısız olan araç sayısı% 26,82 ile 281.000 idi. Denetimde başarısız olan araçlar, çoğunlukla GB / T 32960 gereksinimlerini karşılamamaktadır.
Araç ilgili denetimi geçip ulusal platforma başarıyla bağlanmasına rağmen, fiili operasyonda hala birçok hata vardı. Rapor, otomobil şirketindeki yanlış verilere sahip araç sayısının, otomobil şirketindeki toplam araç sayısının% 50'den fazlasını oluşturduğunu ve% 83,5'ten fazlasını oluşturduğunu gösteriyor. Bu rakam gerçekten iyimser değil.
İlk 8 hata türü çoğunlukla araç bilgisi edinme modülünün düşük doğruluğu ve zayıf aktarımdan kaynaklanır.
Ulusal standart GB / T 32960-2016'nın gerekliliklerine göre, yeni enerji aracı ulusal denetim platformunun gerçek zamanlı bilgi toplama öğeleri, tahrik motorları, araç konumları, eksiksiz araçlar, aşırı değer verileri, alarm verileri ve arıza altındaki tek veriler dahil olmak üzere 61 öğeyi içerir.
İlk 8 hata türü arasında en yüksek hata oranına sahip madde% 16,76'lık "Araç durumu boş veya yanlış"; dördüncü hata kategorisi ise% 4,82'lik ücret alma durumunun boş veya geçersiz olmasıdır. . Bu fenomen, bazı araç modellerinin şarj durumu algılama cihazının hasar görmesinden kaynaklanabilir.
Yukarıdaki iki tür hataya ek olarak, diğer ilk 6 hata türü pil hücresi sorunlarıdır. Ünitenin sıcaklık ve voltajı hataları da dahil olmak üzere, ön karar, yerleşik bilgi edinme modülünün doğruluğunun düşük olduğu ve iletilen verilerin kalitesinin zayıf olduğudur. . Paket kayıp oranı 1'den büyük olan hatalı araçların oranı ve 30 saniye içinde 2 kilometreden daha fazla kilometre atlaması açısından bakıldığında, yerleşik veri toplama cihazının doğruluğunun ve aktarım hızının iyileştirilmesi gerektiğini göstermektedir.
Araba şirketlerinin veri kalitesi eşit değil
Sübvansiyon muhasebesini etkileyebilir
Raporda, farklı şirketlerin veri kalitesi büyük ölçüde değişiklik gösteriyor. Bazı şirketler, platform araçlarına erişirken% 100 hata oranına sahiptir. Şirketin araç verisi hata oranı% 50'den fazla olup, toplam şirket sayısının% 70,4'ünü oluşturuyor ve yalnızca az sayıda otomobil şirketi daha iyi veri işlemesine sahip. Yeni Enerji Araçlarının Ulusal Büyük Veri İttifakı aynı anda "Yeni Enerji Aracı Büyük Veri Endeksi TOP-n Modellerini" yayınladı ve bu modellerin verileri iyi.
Bir şirket araç veri hatası durumu
Bir örneğe bakalım, bir şirket, platforma bağlı toplam araç sayısı 29631, araç veri hata oranı% 94,4 ve ortalama tek araç hata sayısı 2883'tür. Spesifik hata veri öğeleri, pil hücresi voltajının en yüksek değerini ve paketteki gerçek hücre voltajı değerini içerir, hibrit mod motorunda veri yoktur, araç hızı 0'dan büyüktür ve araç durumu durur, kilometre boş veya geçersizdir, vb. Liu Peng analiz etti,
"
Bu şirkette pillerle ilgili veri öğelerindeki hataların oranı% 71,7'yi aştı. Yeni enerji araçlarının önemli bir bileşeni olan güç bataryaları, tüm aracın performansını doğrudan etkiler.Zayıf batarya veri kalitesi, yeni enerji araçlarının güvenliğini doğrudan etkileyecektir.
"
Ayrıca Liu Peng, şirkete, bu şirketin `` boş ya da geçersiz '' hata maddelerinin% 5'e yakın olduğunu hatırlattı.Bu öğenin ortaya çıkması, şirketin aracının gerçek kilometresi ile bildirilen kilometre arasında belirli bir sapma olduğunu ve bunun da otomobil şirketini doğrudan etkileyeceğini hatırlattı. Kilometre doğrulaması.
Son yıllarda, Changan Automobile ve SAIC Motor gibi araç şirketleri, ürün geliştirme, araştırma ve geliştirme, satış ve servis için büyük verinin değerini birden çok yönde kullandı. Ningde Times gibi pil şirketleri, büyük verinin değerinin, arıza izleme ve erken uyarı sistemleri yoluyla araçların güvenliğini ve kontrolünü sağlamak, izleme sistemleri aracılığıyla bakım maliyetlerini düşürmek ve operasyonel verimliliği artırmak olduğuna inanıyor.
Sensörler, veri toplama cihazları ve piller gibi donanım faktörleri dışında yeni enerji aracı platformunda bulunan 72 tür veri hatasını analiz edin, Kurumsal platform veri yerleştirme ulusal platformunun gerçek zamanlı iletiminde verilerin çatışması ve tutarsızlığı , Bu da büyük veri kalitesi sorunlarına yol açar.
Öyle ya da böyle, Büyük veri değeri madenciliğinin temeli veride yatmaktadır.Veri kalitesi, büyük veri analizi sonuçlarının güvenilirliğini doğrudan etkiler . Verilerin standartları karşıladığından ve eksiksizlik, doğruluk, istikrar ve tutarlılığın nasıl sağlanacağı, araç büyük veri analizi için önemli bir konu haline gelecektir.
Metin: Liu Xiuhong Editör: Meng Xuan
Flaş haber hattı:
010-56002742; qcb010@163.com