Bir de bu soruların arasında “Semantik” denilen kavram daha çok önem kazanmaya başladı. Sosyal Medya takip araçları artık sadece data getirip grafikler vermiyor. Gelen datanın pozitif ya da negatif olduğunu da öğrenebilecek teknolojiye sahipler. Yine de gördüğüm takip araçlarında %70’in üzerinde başarı sağlayanı yok. Buna Radian6 ve Alterian da dahil…
Elbetteki Türkçe datalardan bahsediyorum.
Semantik kavramı sayesinde bu araçlar önceden sisteme tanımlanmış negatif ve pozitif kelimelerin yoğunluğuna bakarak bir data hakkında “Bu data pozitiftir” şeklinde yorum yapabilmekteler. Birçok araç bu konuda farklı algoritmalar kullanarak karar mekanizması oluşturmakta. Kimileri negatif ve pozitif kelimeleri müşteriden isterken, kimileri de bu kelimeleri sistemde hazır bir hale getirerek data okumakta ve analiz edebilmekte.
Eleman maliyetine son…
Aslında bu datalar bir / birkaç kişi tarafından okunarak yorumlanır ve pozitif, negatif, nötr şeklinde işlenir. İşlenen bu veriler sistem tarafından anlam kazanacak olan grafiklerin oluşmasını sağlar. Bazı ilgisiz veriler de araya karışabilir. Bu ilgisiz verilerin de sisteme tanımlanan kelimeler içerisinden ayıklanıp silinmesi gereklidir. Aslında semantik kavram tam burada işimize yarıyor. Sistem otomatik olarak tüm dataları analiz edip anlam kazandırmakta ve bize raporlar sunabilmekte.
Pozitif, negatif ve nötr kavramları…
Bu araçların getirdiği datalar birileri tarafından tek tek okunarak pozitif, negatif ve nötr olarak değerlendirilir. Bu değerlendirmeyi yapan kişilere de önceden marka, kampanya ve markanın stratejileri hakkında bilgi verilmek zorunda. Onların bu bilgiler dahilinde okudukları dataları analiz edebilmeleri biraz da olsa tecrübe sahibi olmalarından geçer. Siz data işleyen bu elemanlara ne kadar çok bilgi verirseniz o kişiler de bu dataları pozitif, negatif ve nötr olarak değerlendirirken o kadar doğru iş yapabilirler.
Aksi takdirde markanız hakkındaki olumlu bir datayı olumsuz düşünebilirler, ya da olumsuz bir datayı nötr olarak düşünüp arka plana itebilirler…
Bazı datalar var ki 2-3 farklı kişinin okuması ile 2-3 farklı anlam çıkarabilir.
Mesele doğru anlamı çıkarmaktır. Doğru anlamı çıkarabilmesi için da bu datanın okunarak yorumlanmasından geçer. Semantik kavramı ise tam burada çakılabiliyor. Sistem biraz daha farklı işliyor. Gördüğüm hemen hemen birçok araç bu değerlendirmeyi yaparken gelen data içerisindeki kelimeleri inceleyerek karar verir. Negatif kelime oranı pozitif kelime oranından yüksek olduğu takdirde sistem değerlendirmeyi “Negatif” olarak belirleyecektir. Fakat bir yazı içerisinde çok negatif kelime varken yazı pozitif bir anlam taşıyabiliyor. Ya da tam tersi, konuşan kişi dalga geçiyordur fakat sitem bunu pozitif algılayabilir!
Semantik teknolojiler burada yanlışa düşüyor.
Sanırım bilgisayarlarımız gerçek “Yapay Zeka” ya kavuşmadan semantik kavramının tam anlamı ile başarıya ulaşması zor olacak. (Elbette ki Türkçe dili için bunu konuşuyorum.) Semantik kavramını kullanan yazılımlara bu yüzden güvenemiyorum. En büyük sorun data işlemenin zor olmasıdır. Semantik bunu kolaylaştıracağına zorlaştırıyorsa işiniz tehlikeye girecektir. Çünkü verilen rapor yanlış olarak karşınıza geliyor. Başarı oranı %95’lerin altındaki semantik kavramları raporları ile sizi yanıltabilir / çoğu zaman da yetersiz kalabilir. Eğer başarı oranı düşükse sizin tek tek bütün dataları elden geçirmeniz gerekecektir.