Twitter’da Aktör-Konu Ağlarının Otomatik Analizi: Sosyo-Semantik Ağ Analizine Yeni Yaklaşımlar-I
Iina Hellsten
Amsterdam Üniversitesi
İletişim Araştırmaları Okulu
Loet Leydesdorff
Amsterdam Üniversitesi,
İletişim Araştırmaları Okulu
Sosyal medya verileri,
büyük metinsel doküman setlerinin otomatik analizleri için gittikçe artan
olanaklar sunmaktadır. Bugüne kadar otomatik araçlar ya tartışmaya
katılan katılımcılar arasındaki sosyal ağların ya da bu tartışmaların
içeriklerinin analizleri için geliştirilmiştir. Sosyo-semantik ağlar olarak ele
alınabilecek çevrim içi tartışmalarda aktörler (katılımcılar/participiant) ile konuların
(içerik/content) ortak oluşumlarının (co-occur) haritalanmasına daha az ilgi
gösterilmiştir. Çevrim içi tartışmaları anlamak ve görselleştirmek için; ortak
ele alan konuların ve aktörlerin bütün matrislerini kullanan yeni, otomatik bir
yaklaşım sunmaktayız. İki veri setini analiz ederek yeni yaklaşımın
avantajlarını göstermekteyiz: İlki, 2012 Haziran’ındaki Rio 20 toplantısıyla
ilgili geniş bir İngilizce Twitter iletileri seti (72.077 ileti) ve ikincisi de
2015-2017’deki kümes hayvanlarıyla alakalı kuş gribine dair küçük bir
Hollandaca Twitter iletileri setidir (2.139 ileti). Yaklaşımımızın kuramsal,
metodolojik ve somut etkileri ile diğer sosyal medya veri analizlerine
uygulanmasını tartışmaktayız.
Giriş
Sosyal medya verileri sosyal
bilimcilere çevrim içi tartışmalardaki karmaşık sosyal etkileşimlerin geniş bir
metinsel derlemelerini sunmaktadır. Şimdiye kadar ağ araştırmasının iki ayrı
kolunda nitel yöntemler ve otomatik araçlar geliştirilmiştir. Bir tarafta,
aktörler ağına odaklanan aralarındaki ilişkiler ile yapıları haritalandıran
sosyal ağ analizleri (Borgatti & Everett, 1997; Wasserman & Faust,
1994; Borgatti & Foster, 2003) diğer tarafta ise bu iletilerin içeriğini
analiz etmek için kullanılan semantik ağ (anlam ağı) haritalama bulunmaktadır.
Bunlar:
i) Ortak oluşan kelimelerin
modellemesi bakımından içerik haritalama (content mapping) (Danowski,
2012; Diesner, 2013),
ii) Konuları; kelimelerin ortak
oluşum ağlarındaki kümelenmeleriyle saptama (Örneğin; Carley & Kaufer,
1993; Courtial, 1994; Danowski,2012; Diesner, 2013; Leydesdorff, 1989 ve Leydesdorff,1991),
iii) Kelime ortak oluşumundaki (word
co-occurence) gizli yapıları yansıtan örtük çerçeveleme ((Hellsten, Dawson,
& Leydesdorff,2010; Leydesdorff & Hellsten, 2005).
Her iki yaklaşım -sosyal ağ analizi
ve semantik ağ analizi- sosyal medyadaki iletişime dair kısmi bir bakış
sunmaktadır. Sosyal ve semantik ağların birleştirilmesi çevrim içi tartışmaları
anlamak için daha kapsamlı bulgular sağlayabilir. Tartışmalardaki aktörlerin ve konuların ortak
oluşumlarını analiz etme zorluğu sosyal ve semantik ağ analizinden elde edilen
fikirleri birleştirmeyi gerektirir. “Bütün matrisini (whole matrix)” kullanarak
aktör-konu ağları haritalamaya dair bir yaklaşım sunmaktayız. Ayrıca Borgatti
ve Everett’in (1997) 2-modlu ağ analizi yaklaşımına kıyasla bu yaklaşımın
yararlarını tartışmaktayız. Yaklaşımımız sosyo-semantik ağları haritalamada hem
ağ metodolojisi hem de kuramsal odağı bakımdan yenilikçidir. Bütün matris
(whole matrix) yaklaşımı; bir bütünleşik tasarımda (integrated design) hem
ayrışık (heterogeneous) hem de türdeş (homogeneous) düğüm (node) ve bağlantı
(link) kümelerini haritalamamıza olanak sağlamaktadır.
İlk olarak metodolojik açıdan sosyal
ağ analizinde önde gelen iki parçalı ağın (bipartite network) temsili olarak
2-modlu matris yaklaşımını (Everet&Borgatti, 2013) geliştirmekteyiz. Tweetlerde
bahsedilen aktörler ve konular matrisini dikkate almayı önermekte ve daha
enformatif sonuçlar sağlamada bu yaklaşımın avantajlarını göstermekteyiz.
Aktör-ağ kuramından (Latour, 1996) esinlenerek odağı sosyal aktörler ve onların
semantiğinden hem aktör hem de konuların ortak ele alınmasına kaydırmaktayız.
Sosyal ağ analizleri iletilerin yazarları ve yazarın bahsettiği aktörler
arasındaki etkileşimle ilgilenmesine karşın, iletilerin içeriğinde bahsedilen aktörler ve konular arasındaki etkileşime
odaklanmaktayız. Odaktaki bu kayma; iletilerin yaratımı (authoring) olarak
sosyal aktörlere daha az odaklanan ve konular bakımından ele alınan diğer
aktörlere daha fazla odaklanan sosyal bilimde kuramı inşa etmek için yeni yollar
açmaktadır.
Büyük ölçüde odağımız Twitter
iletilerine dairdir ve etiketlerin ortak oluşumlarını (konuların temsilleri
olarak) ve kullanıcı adlarını (adresli aktörler olarak) haritalamaktır. Ayrıca,
tek görselleştirmede üç farklı düğüm tipinin (yazar, bahsedilen kişi/kurum ve
konular) kullanıldığı 3 modlu yaklaşıma doğu bir genişleme göstermekteyiz. Özetle,
kimin (hangi yazar) hangi kavramları (konuları) kullandığını sormaya ek olarak aktörlerin
ve konuların iletişimde ortak oluşumları da sorulabilir. Bu araştırma sorusu;
Aktör Ağ Kuramındaki (Actor Network Theory/ANT) aktörler ve konuları diğer
taraftan semantik ve sosyo-semantik ağ analizini birleştirme çağrılarına
dayanmaktadır.
Kuramsal
Çerçeve: Ağ Yaklaşımı
Aktör Ağ Analizi (Actor Network
Analysis/ANT); insan ve insan olmayan faillik (agency) arasındaki sosyal
etkileşimlere dair ilişkisel perspektifi olarak 1980’lerin başından itibaren
bilimin-sosyal-çalışmaları (social-studies-of-science) geleneği içinde
geliştirilmiştir. Semiyotik gelenekte (göstergebilim) semantik ve sosyal
ilişkiler “eyleyenler (actant)” olarak görülmektedir (Callon & Latour,
1981; Latour, 1996). Eyleyenler bir ağ ile ilgili insan veya insan olmayan
failleri temsil edebilirler (Callon, 1986). Ayrıca hem insan hem de insan
olmayan eyleyenler düşüncesine ek olarak, Aktör Ağ Kuramı (Actor Network
Theory/ANT) sosyal ağ analiziyle benzer bir şekilde ağları kapsayıcı bir
ilişkisel ve dinamik sosyal kuram kullanarak kuramlaştırmaktadır.
İnsan failleri arasındaki etkileşime
odaklanan sosyal ağ analizinin tersine Aktör Ağ Kuramı insan olmayan faillere
de odaklanmaktadır ve “belli bir öğenin; yönettiği bağlantı sayısıyla nasıl
stratejik hale geldiğini ve bağlantılarını kaybettiğinde önemini nasıl
kaybettiğini izlemeyi” (Latour, 1996, s. 372) amaçlamaktadır. Bizim
yaklaşımımız sosyal medya tartışmalarında aktörler arasındaki sosyal
ilişkilerin yerine bağlantıların gösterge sürecine (semiosis) odaklanmaktadır. Twitter
iletişiminde eyleyenler olarak ele alınan kullanıcı adları (username) ve
etiketleri (hashtag) analiz etmekteyiz. Kısaca, kimin hangi konuları ele
aldığını değil kimin hangi konularla ortak ele aldığını sormaktayız.
Aşağıda iletişimin kökenindeki
sosyal failleri “yazar (author)” ve iletişimde ele alınan aktörleri “bahsedilen
(addressee)” olarak isimlendireceğiz. Aynı zamanda aktör ağ terminolojisindeki
“eyleyenler (actants)” kavramı da, birlikte bahsedilen (co-adresses) konuları
ve aktörleri ifade etmektedir.
Daha geniş ağ kuramına göre
yaklaşımımızı konumlandırmak için öncelikle ağ analizlerinin iki kolunu
tartışmaktayız. Bu iki kol -sosyal ağ analizi ve semantik, ortak kelime
(co-word) analizi- temelde birbirinden bir adım uzunlukta geliştirilmiştir (Ancak, bkz, Roth & Cointet, 2010; Roth,
2013). Anlamlı sosyo-semantik ağları kuramsallaştırmanın güçlüğü ve enformasyon
bilimleri ile iletişim çalışmalarındaki ampirik araştırmaları nasıl
değiştirebileceği veya zenginleştirebileceği aşikar bir sorun olarak kalmıştır.
Sosyal ağ analizinde;
“yazar” olarak nitelendirilen sosyal aktörler arasındaki etkileşimleri ölçümlendirmek
için metodoloji, son on yirmi yıl içinde geliştirilmiştir ((Wasserman &
Faust, 1994). Sosyal gruplara bağlı aktörlerin iki parçalı ağları (bipartite
network); gruplara karşı aktörlerin 2 modlu bağlantı ağlarını sağlamaktadır
(Breiger, 1974). Bilgisayar programları, önemli yazarları ağlardaki
merkeziyetleri yönünden belirlemeyi mümkün hale getirmektedir. Sosyal ağ
analizinde, sosyal yazarlar ve birbirleriyle ilişkilerinin yanı sıra yazarlar
ve niteliklerinin iki parçalı matrisleri incelenmiştir (Borgatti & Everett,
1997). Buna karşın, bu metodoloji iletişimin semantik içeriğine erişim
sağlamamaktadır.
İletişimin içeriği; 1990’ların
başından beri akademinin giderek artan bir biçimde ilgisini çeken semantik ağ
analizi (Landauer, Foltz, & Laham, 1998) konusu olmuştur
((Leydesdorff, 1989; Leydesdorff, 1991; Leydesdorff, 1997). Özellikle -biri
insan veya bilgisayar destekli kodlamanın önde olduğu ikincisi ise semantik
ortak kelime haritaları için otomatikleşmiş analizlerin uygulandığı- iki
farklı gelenekçe. Örneğin; Carley ve Kaufer (1993); bu iki temsiliyetin çapraz
döllenmeye ihtiyacı olduğunu iddia ederek sembollere odaklanan araştırma
alanlarının semantik ağ analiziyle birleştirilmesine dikkat çekmektedirler.
Bilahare bu yaklaşım metin(ler)deki
kelimeleri örneğin- bireysel isimler, kuruluş isimleri ve diğer alakalı
kategoriler (Diesner, 2013) gibi kategorilere kodlamaya dayanan özel yazılım
paketlerini kullanarak (Örneğin; AutoMap ve ORA) kavram ağlarının yapıları
üzerinde sistematik araştırmayı ayrıntılandırmıştır.
Özellikle, Diesner ve Carley (2005)
semantik ağ analizine meta-matris yaklaşımı olarak tanımlanan bir yaklaşım
önermişlerdir. Bu yaklaşım ve ilgili ORA yazılımı dört içerik ögesi arasında
ayrımda bulunur: (i) Failler (agent), (ii) Bilgi kategorileri (iii) Kaynaklar
ve (iv) süreçler veya görevler. Bu tasarımın amacı organizasyonlardaki dengesizliklere
işaret etmektir. Yaklaşımımız nitelik matrislerini (attribute matrices)
ayrıştırmaya odaklanırken teknik olarak meta-matris yaklaşımı bağlantılı
matrisleri (affilition matrices) birleştirmektedir. Kanaatimize göre, iki
yaklaşım analitik olarak farklıdır ve farklı amaçlara hizmet etmektedir. Oysaki
semantik ağ analizi için meta-matris yaklaşımı veri temizleme ve elle veya
kısmen otomatik, kelime destekli metinlerin kodlanmasını gerektirirken
yaklaşımımız tamamen otomatiktir. Kodlama sonrasında, büyük metin setinin
otomatik ağ analizi için meta-matris yaklaşımı kullanılabilir (Pfeffer &
Carley, 2012). Bu yaklaşım, -bize göre- elle ve otomatik içerik analizi
yelpazesini genişletmektedir.
Elle yapılan geleneksel içerik
analizinde (Örneğin; Krippendorff, 1989) odak, bir kodlama şeması tasarlarken
kodlayıcılar tarafından önceden oluşturulan belirli çerçeveler üzerindedir.
Sonrasında; ortaya çıkan kavram ağları sonuçları (tek kelime ve/veya cümleden
ibaret) metinlerdeki örtük veya ortaya çıkan anlamlar yerine kodlayıcının
önemli kavramları yorumlamasını temsil eder. İlke olarak, bu tür
sosyal-bilim-esinli metin analizleri bilişsel dilbilim (cognitive linguistic)
gibi dil çalışmalarında geliştirilen nicel metotlarla oldukça benzerlik taşır (Sanders
& Spooren, 2010).
Son dönemlerde, otomatik analizler
hem içerik analizine hem de semantik ağ analizine uygulanmıştır. Otomatik
içerik analizi; dokümanlarda inşa edilen aktörler ve konuları elle yapılan
çağrışımsal çerçevelerle (associative frame) çıkarmaya odaklanmakta (Örneğin;
Schultz, Kleinnijenhuis, Oegema, Utz& van Atteveldt, 2012) ve otomatik küme
ve duygu analizi (sentiment analysis) kullanmaktadır (Örneğin; Burscher,
Vliegenthart ve De Vreese, 2015). Faktör analizi bir kelime/doküman matrisini
kullanarak otomatik konu analizinde kullanılmaktadır (Leydesdorff
& Welbers, 2011; Vlieger ve Leydesdorff, 2011). Faktör analitik yaklaşımı; konuları
saptamak için belirli konulara ait kelime atayarak (assign) ve konulardaki kelimelerin
ortak oluşum kelimelerini belirleyerek kelime dağılımlarını kullanan konu
modelleme (topic modelling) ile
karşılaştırılabilir. Özellikle olasılık dağılımlarını kullanarak kelimeleri
kümelere atayan Latent Dirichlet Allocation (LDA) yöntemiyle (Blei, Ng ve
Jordan, 2003). Bu yöntem büyük doküman
setlerinin analizine uygulanmıştır (Örneğin; Jacobi, van Atteveldt, &
Welbers, 2016).
Bir başka ağ semantik kolunda Leydesdorff
ile Hellsten (2005) ve (2006), insan kodlaması olmadan metinsel dokümanlardaki
örtük çerçeveleri açığa çıkarmak amacıyla otomatik semantik ortak oluşum kelime
haritaları geliştirdi. Kelimeleri haritalamak için vektör-uzay modeli
(vector-space model) olarak da bilinen
bu modelleme kelime/doküman matrislerine dayanmaktadır (Salton ve McGill, 1983; Turney ve Pantel,
2010). Kelime/doküman matrisini kullanarak, sadece ortak oluşum kelime
ikiliklerini dikkat almaz aynı zamanda tek kelimeleri, üçlüleri vb. de göz
önünde tutar. Ayrıca ortak oluşum kelimeleri arasındaki ilişkilere ilaveten bu
yöntem vektör uzaydaki kelimelerin konumlarını hesaba katabilir (Örneğin; bkz.
Leydesdorff & Hellsten, 2005). Düğümler (nodes) bir ilişki olmaksızın eşdeğer
konumlar işgal edebilirler.
Aktör Ağ Kuramına bir uygulama sunmasının
yanında yaklaşımımız; sosyo-semantik ağ analizine geniş ölçüde uygulanabilecek
metin dokümanlarında birlikte ele alınan (co-adresses) aktörler ve konuların
otomatik analizini de sunmaktadır. İki düğüm tipli iki parçalı ağların yerine
konular ve bahsedilenler (addressees) 2-modlu nitelik ağı (attribute of
network) olarak temsil edilebildiğini yani kelimelerin iki türü ile birlikte
(@kullanıcı adı ve #etiket) bir semantik ağ olduğunu savunmaktayız. Bir sonraki
adımda, Aktör Ağ Analizi ontolojisinin ötesine geçilebilir ve etiketler,
mesajların “yazarı” olamazken bahsedilenler, Twitter mesajlarının potansiyel
yazarları olarak görülebilir. Bu meyanda, ontolojimiz Aktör Ağ Analizinden
farklıdır.
Bütün-Matris
Yaklaşımı (Whole-Matrix Approach)
Bütün-matris yaklaşımını aşağıdaki
gibi işlevsel hale getirmekteyiz. Her bir tweet hem bahsedilen aktörlerin
(@kullanıcı adları) hem de konuların (#etiketler) atfedildiği bir analizi
birimi olarak düşünülebilir. Ortaya
çıkan kelimelere karşı dokümanlar matrisi asimetriktir. Ancak tek
geçişle/single pass (Devrik
matrisin/transpose matrix çoğaltılmasıyla) hem etiketler ve hem de kullanıcı
adlarının bağlantılı matrisi (affiliation matrix) yaratılabilir. Kullanıcı adlarına
(nitelik olarak) karşı 2-modlu etiket matrisi bu matriste köşegen dışı
(off-diagonal) altçizge (subgraph) olarak bulunurken ortak etiketler
(co-hashtag) ve ortak-kullanıcı adı (co-username) matrisi ana köşegen boyunca
konumlandırılır (Şekil 1 ve Şekil 2).
Şekil 1’deki
matris; kütüphane ve enformasyon bilimi (Salton & McGill, 1983) yaygın
olarak kullanılan sosyal ağ analizinde (Borgatti
& Everett, 1997) ve son dönemlerde semantik ağ analizindeki (Örneğin; Yang
& González-Bailón, 2017) kelime/doküman matrisine benzemektedir. Şekil 2;
aktörler ve konuların semantik ağları ile onların tek bir temsildeki
ilişkilerini içeren bütün matrisini (whole matris) göstermektedir.
Sosyo-semantik
ağ analizinde bütün matris (whole matrix) sonuçlarının iki parçalı 2-mod
matrisi (bipartite 2-mode matrix) dayananlardan daha enformatif sonuçlar
sunduğunu iddia etmekteyiz. İki parçalı yaklaşım (bipartite approach) sadece
#etiket ağlarındaki @kullanıcı adını yakalarken özellikle bütün matris
yaklaşımı (whole matris approach) hem etiket ağlarındaki @kullanıcı adını hem
de @bahsetmedeki @bahsetmeyi veya #etiket ağlarındaki #etiketi yakalar.
Köşegen dışı alt grafikler
(off-diagonal subgraph); özgün yazarların tweette @bahsedilen diğer
kullanıcıları etiketlere ekleme niyetlerini temsil etmektedir. Aşağıdaki sonuç
bölümünde; ikiden fazla boyuta kıyasla bu ek seçeneğin artılarını ve muhtemel
genişlemesini göstereceğiz.
./..
Yorumlar
Yorum Gönder