Toshiba Corporation, ticari bir kamerayla çekilen görüntüyü kullanarak ve kamera merceğinin neden olduğu görüntü bulanıklığını derin öğrenme kullanarak analiz ederek, mesafeyi bir stereo kameranın doğruluğu ile ölçebilen 3D tanıma özellikli bir yapay zeka geliştirdi. Bu teknoloji, sonunda maliyeti ve alanı azaltan stereo kameraların kullanımını ortadan kaldıracaktır. Toshiba, bu başarıyı 30 Ekim 2019'da Güney Kore'de saat 10: 00'dan itibaren düzenlenecek olan bilgisayarla görme konulu uluslararası konferansta (ICCV2019) sunacak.
Görüntü algılama giderek daha önemli hale geliyor ve nesneleri hareket ettiren robotlar, otonom insansız araçlar, altyapıyı denetleyen uzaktan kumandalı insansız hava araçları vb. Uygulamalar, konuların görüntülerinden daha fazlasını gerektiriyor, şekil ve mesafeyi dahil etmek için 3D verileri analiz etmek için küçük bir cihaza ihtiyaç duyuyorlar. Bu nedenle, görüntülenen nesnenin şekli, arka planı ve diğer manzara verilerinin daha iyi öğrenilmesi için derin öğrenme kullanılarak monoküler kameralarla (küçültülmesi kolaydır) bir ölçüm teknolojisi geliştirmek için araştırmalar artırılmıştır.
Bu yöntemin bir dezavantajı vardır; Mesafenin doğruluğu, öğrenilen manzara verilerine bağlı olarak monoküler bir kamera yardımıyla tahmin edilir ve bu da farklı manzaralarda çekilen çekimler nedeniyle doğruluk düşüşüne neden olur. Bunun üstesinden gelmek için Toshiba, lense iki renk filtresinin takıldığı ve ortaya çıkan görüntü bulanıklığının rengi ve boyutunun özneden uzaklığa göre analiz edildiği renk filtreli açıklık fotoğrafçılığı geliştirmiştir. Bu, veri bağımlılığı sorununu çözse de, mevcut lensleri değiştirmek zaman ve para gerektirir.
Toshiba, stereo kamera sistemiyle aynı yüksek hassasiyette mesafe ölçümü elde etmek için, görüntünün lens üzerindeki konumuna göre nasıl bulanıklaştığını analiz etmek için derin öğrenmeyi kullanan 3B tanıma teknolojisi ile yapay zeka geliştirerek bu sorunun üstesinden gelmiştir.normal bir monoküler kamera ile ancak manzara verilerine ihtiyaç duyulmadan. Şimdiye kadar, mesafeyi bulanıklığın şekline göre ölçmenin teorik olarak imkansız olduğu düşünülüyordu; bu, hem uzak hem de uzak nesneler için odak noktasından eşit uzaklıkta olduklarında aynıdır. Ancak analitik sonuçlar, odak noktasından eşit uzaklıkta olsalar bile yakın ve uzak nesneler arasında önemli bir fark olduğunu göstermiştir. Bununla Toshiba, derin sinir ağı modeliyle eğitilmiş bir derin öğrenme modülü tarafından yakalanan görüntülerden bulanıklık verilerini başarıyla analiz etti.
Işık mercekten geçtiğinde, oluşan bulanıklığın şeklinin ışığın dalga boyuna ve mercekteki konumuna bağlı olarak değiştiği bilinmektedir. Geliştirilen ağda, konum ve renk, bulanıklık şeklindeki değişiklikleri doğru bir şekilde algılamak için ayrı ayrı işlenir ve ardından ağırlıklı bir dikkat mekanizmasından geçtikten sonra, mesafeyi doğru bir şekilde ölçmek için parlaklık gradyanının odaklanacağı yeri kontrol eder. Öğrenme yoluyla ağ, ölçülen mesafe ile gerçek mesafe arasındaki bir hatayı azaltmak için güncellenir. Bu yapay zeka modülünü kullanan Toshiba, piyasada bulunan bir kamerayla çekilen tek bir görüntünün stereo kameralarla korunan aynı mesafe ölçüm doğruluğunu gerçekleştirdiğini doğruladı. Toshiba'nın bu resmi sayfasında daha fazla bilgi bulunabilir.
Toshiba, piyasada bulunan kameralar ve lenslerle sistemin çok yönlülüğünü teyit edecek ve 2020 mali yılında kamuya açık uygulamayı hedefleyerek görüntü işlemeyi hızlandıracak.