g u t x .com.tr İpek yolu - Çin'i anlamaya götürürüm

Veri maliyeti beşikteki yapay zeka girişimlerini öldürecek mi?

[Lieyun.com (WeChat ID :)] 14 Kasım raporu (derleme: Zhang Lulu)

Not: Bu makalenin yazarı Ivy Nguyen, Zetta Venture Partners'da yatırımcıdır.NewGen Capital'de kıdemli asistan olarak görev yapmıştır ve ImageH2O'da girişim hızlandırıcı projesini yönetmiştir. Yazar, mevcut veri patlaması döneminin arka planına dayanarak, verilerin yeni başlayanlar için önemini tartışıyor ve çeşitli veri toplama, depolama, yönetim ve modelleme süreçlerinden maliyet sorunlarını analiz ediyor ve bazı olası maliyet tasarrufu sağlayan yöntemler önermektedir. .

Şu anda, veriler yavaş yavaş yapay zeka girişimlerinin "altın çanı" haline geldi: yeni başlayanlar ne kadar çok veri toplarsa, daha iyi yapay zeka modelleri eğitilebilir ve bu da yeni pazar rakiplerinin eşleşmesini zorlaştırır. Bununla birlikte, bu veriler ücretsiz olarak elde edilemiyor ve birçok yapay zeka başlangıcı, bu ek maliyetin karlarını büyük ölçüde aşındırdığına inanıyor. Zamanla, bu şirketler verilere yaptıkları yatırımları azaltmak isteyebilirler, ancak bu durumun ne zaman ortaya çıkacağını nasıl tahmin edecekleri ve bu şirketin gelecekteki büyümeyi modelleme kabiliyetini ne ölçüde artıracağı net değildir. Zorluk.

Yazılım başlangıçlarında, ürün geliştirme maliyetleri, gelir tablosundaki Ar-Ge maliyetleriyle ilişkilendirilirken, yapay zeka girişimleri, satılan malların maliyetinin (COGS) bir parçası olarak veri maliyetlerini kullanır. İkinci yaklaşım, şirketlerin keşfetmesine yardımcı olur Maliyetleri düşürürken ölçeği genişletme ve böylece karlılığı artırma fırsatı.

Aşağıdaki veri değeri zinciri akış şeması, AI girişimlerinin çoğunun verileri nasıl elde ettiğini ve kullandığını gösterir. İlk olarak, şirket temel gerçeklerin parçalarını ham veri olarak kaydeder. Kuruluşlar orijinal verileri bir yerde depolayabilir ve ardından bakım ve erişim için süreçler veya yollar oluşturabilir. AI modeline başvurmadan önce, şirketlerin verileri etiketlemeleri gerekir, böylece AI modeli her bir veri noktasını işleme davranışını uygulayabilir. Daha sonra, iyi eğitilmiş model verileri alır ve kuruluşun son kullanıcının belirli davranışlarını yönlendiren eylemleri gerçekleştirmek için kullanabileceği geri bildirimi üretir. Süreç üç farklı adıma bölünebilir: modelin eğitimi için veri elde etme, veri depolama ve verileri etiketleme. Her adımda ilgili maliyetler olacaktır.

Veri toplama maliyeti

Tüm veri değer zincirlerinde, herhangi bir sensör (ister fiziksel bir cihaz ister insan olsun) ham verileri topladığında, öncelikle gerçekliğin gözlemini yakalamalıdır. Bu durumda, veri toplama maliyeti sensörlerin oluşturulması, dağıtımı ve çalıştırılmasından kaynaklanacaktır. Sensör bir tür donanım ise, şirket malzeme ve üretim maliyetini göz önünde bulundurmalıdır; sensör bir insan ise maliyet, personelin işe alınmasından ve gözlem yapmak ve kaydetmek için ihtiyaç duydukları araçlardan kaynaklanmaktadır. Kapsama alanına bağlı olarak, şirketlerin sensörleri dağıtmak için çok fazla ücret ödemesi gerekebilir. Sadece bu değil, bazı kullanım durumlarında yüksek sıklıkta veri toplama gerekli olabilir ve bu da işçilik ve bakım maliyetlerini artırabilir. Örneğin, bir hedef kitle ölçüm şirketi olan Nielsen'in yukarıdaki tüm masrafları karşılaması gerekir, çünkü sadece bir derecelendirme toplama kutusu sağlamakla kalmaz, aynı zamanda katılımcıların TV programını izlemek için lisans ücretini de alır. Bu şekilde, kapsam genişledikçe ve genişledikçe, Nielsenın verileri daha değerli hale gelir ve ölçek ekonomileri doğal olarak birim veri toplama maliyetini azaltır.

Bazı kullanım durumlarında şirketler, son kullanıcılara iş akışlarını yönetmek için araçlar (örneğin, otomatik e-posta yanıt oluşturucular), iş akışlarında topladıkları verileri depolamak veya araçlarla etkileşimlerini gözlemlemek ve kullanmak için araçlar sağlar. Veri toplama işini ve maliyetini son kullanıcıya aktarmak için veri olarak kaydedilir. Şirketler bu araçları ücretsiz olarak dağıtmayı seçerse, veri toplamanın maliyeti kullanıcı edinme maliyeti olacaktır. Veya şirketler, iş akışı araçları için ücret almayı seçebilir. Bu yaklaşım, müşteri benimsemesini yavaşlatabilir ve sınırlandırabilir, böylece veri toplama maliyetini azaltırken veri toplamayı azaltır. Spesifik azalma ve kısıtlama, şirketin Fiyatlandırma.

Örneğin, şirketimizin yatırım portföylerinden biri olan büyük veri şirketi InsideSales, satış temsilcilerine satış potansiyelleriyle doğrudan bağlantı kurabilecekleri bir platform sağlar. Satış temsilcileri tarafından kullanım sürecinde platform, zaman, mod, diğer meta veriler ve satış kanalındaki satış liderlerinin ilerleyip ilerlemediği gibi etkileşimli verileri otomatik olarak kaydedecektir. Bu veriler, potansiyel müşterilerle iletişim kurmak için en iyi iletişim süresini ve iletişim yöntemini hesaplamak için AI model eğitimi için kullanılacaktır. Bu durumda, daha fazla kullanıcı platforma yerleştikçe, ağ etkilerinin araçların faydasını artırması ve dolayısıyla kullanıcıları edinme maliyetini düşürmesi muhtemeldir.

Diğer bir yol, başka bir kuruluş veri toplama kanalları oluşturduğunda, stratejik bir ortaklığın kurulmasının maliyetleri daha da azaltmasını sağlamaktır. Örneğin, diğer şirketimiz Tractable, otomobil sigortası düzenleyicilerini otomatikleştirmek için bilgisayar vizyonu kullanıyor. Şirket şu anda hasarlı otomobillerin görüntülerini elde etmek için teknolojiler geliştirmek için sektördeki önde gelen birkaç otomobil sigorta şirketiyle işbirliği yapıyor. Ek olarak, araç sahiplerinin uygulamaları indirmesini sağlamamız gerekmiyor, bu da uygulama tanıtımının maliyetinden tasarruf sağlıyor.

Depolama ve yönetim maliyetleri

Veri depolama ve erişim açısından, girişimler de bir maliyet sorunuyla karşı karşıyadır. Veri toplamaya ek olarak, şirketlerin modeli zenginleştirmek için müşterilerin diğer ilgili verileri sağlamasına da ihtiyacı olabilir. Pek çok sektör sadece yakın zamanda kademeli olarak dijitalleşmeyi başardığından, işletmenin ihtiyaç duyduğu verilere sahip herhangi bir potansiyel müşteri hafife alınmamalıdır. Bu verileri elde etmek için şirketler, düşük kar marjları ile veri hazırlamaya çok fazla insan gücü harcayabilirler.

Ek olarak, veriler farklı sistemlere ve silolara dağıtılırsa, modelin tamamen işlevsel olması için şirketin her bir entegrasyonu oluşturmak için çok zaman harcaması gerekebilir. Bazı endüstriler monolitik ve heterojen teknoloji yığınları etrafında inşa edilmiştir ve bu da entegrasyonun müşteriler arasında yeniden kullanımını zorlaştırmaktadır. Bir entegrasyon hizmeti sağlayıcısı mevcut değilse, yapay zeka başlangıcı kısa süre sonra kendisini bir çıkmazda bulabilir: Yalnızca her yeni müşteri için özelleştirilmiş bir entegrasyon oluşturarak, yapay zeka sistemi devreye alınabilir. Verilerin yapılandırılma şekli de müşteriden müşteriye değişebilir, bu da yapay zeka mühendislerinin verileri normalleştirmek veya yapay zeka modelini uygulamak için standartlaştırılmış bir modele dönüştürmek için fazladan zaman harcamasını gerektirir. İşletmeler, yeni müşterilerde yeniden kullanılabileceği için halka açık bir entegre kütüphane kurarak maliyetleri düşürebilir.

Eğitim maliyeti

Yapay zeka modelleri oluşturmaya yönelik çoğu yöntem, yapay zeka girişimleri için en büyük ve en değişken maliyetlerden biri olan veri ek açıklamasını gerektirir. Bu örnekler açık veya anlaşılması kolaysa, meslekten olmayan kişiler onları işaretleyebilir. Örneğin, resimde bazı elmalar çizin ve ardından bir dış kaynak işçi hizmeti olarak işaretlemek için tüm elmaların etrafına bir kutu çizin.

Ancak bazen açıklama, görsel ipuçlarına dayalı olarak bir elmanın kalitesini ve olgunluğunu belirlemek veya bir petrol platformundaki küçük paslı bir noktanın riskli olup olmadığına karar vermek gibi daha fazla uzmanlık ve deneyim gerektirir. Bu daha profesyonel iş gücü için, şirketlerin yüksek maaşlı bir dahili uzman etiketleme ekibi kurması gerekebilir. İşletmenin etiketleme yöntemine bağlı olarak, Labelbox gibi şirketler zaten bu tür araçları sağlamaya başlamış olsa da, kendi etiketleme iş akışı aracını oluşturmak gerekli olabilir.

Bazı yapay zeka uygulamalarında, son kullanıcılar en etkili etiketleyiciler olacaktır.Şirketler, etiketleme maliyetlerini düşürmek için ürünler tasarlayabilir, böylece kullanıcılar ürünlerle etkileşimde bulunurken verileri işaretleyebilir. Örneğin, Constructor, e-ticaret için yapay zeka web sitesi araması sağlar, kullanıcılar tarafından gerçekten tıklanan ve satın alınan her ürünün arama terimlerini gözlemler, böylece bu web siteleri daha yüksek satışlar elde etmek için arama sonuçlarını optimize edebilir. Bu tür etiketleme, dış kaynak kullanımı veya uzman arama hizmetleri aracılığıyla manuel olarak gerçekleştirilemez ve bu yöntem, Yapıcı'nın potansiyel büyük etiketleme maliyetinden büyük ölçüde tasarruf sağlar.

Yüksek hassasiyetli eğitimde bile, model yeni bir girdiyi doğru bir şekilde açıklayamadığında, yine de ara sıra manuel müdahale gerektirir. Modelin son kullanıcıya değer sağlama şekline göre, kullanıcı modeli kendisi düzeltebilir veya açıklama ekleyebilir ve şirket, kalite kontrolün "AI dadı" nı kullanarak istisnaları da halledebilir. Şirketin modelleme yaptığı ortam istikrarsızsa ve değişim oranı yüksekse, şirketin modeli gerektiği gibi yeni verilerle güncellemek için bir dizi etiketleyiciyi kararlı bir durumda tutması gerekebilir.

AI işini genişletin

İlk başarılı AI şirketleri pazara girdiğinde, AI içermeyen iş akışı araçları sağlayarak AI modellerini eğitmek için verileri topladılar ve veriler sonuçta araçların değerini artırdı. Veri ve yapay zeka, değer önermelerinde ikincil bir rol oynadığından, bu girişimler erken aşamalarda yazılım karlarını gerçekleştirebilirler. Bununla birlikte, pazar daha profesyonel AI uygulamalarına geçtikçe, AI girişimlerinin bir sonraki dalgası daha yüksek başlangıç maliyetleriyle karşılaşacak ve müşterilere başlangıç değeri sağlamak için daha fazla insan gücü tüketecek ve bu da düşük marjlı hizmet şirketlerine yol açacak.

Çok sayıda müşteri ve veri elde etmek, nihayetinde birim ekonomisini azaltacak ve kritik bileşik savunma yetenekleri oluşturacaktır, ancak birçok yeni şirket bunu tam olarak bilmiyor ve hedeflerine daha hızlı ulaşmak için hangi önlemleri almaları gerektiğini anlamıyor. Mükemmel AI girişimleri, bu şekilde ödünleşmeleri optimize edecek, planlı bir şekilde yatırım yapacak ve hızla genişleyecektir.

Ekim ayında, posta endüstrisinin toplam iş hacmi, yıllık% 24,8 artışla 112,37 milyar yuan'ı tamamladı.

"Eğitim Sektörü Mavi Kitap 2018": Orta sınıf kaygısı, sektörün büyümesi için en büyük itici güç haline geldi