Twitter’da Aktör-Konu Ağlarının Otomatik Analizi: Sosyo-Semantik Ağ Analizine Yeni Yaklaşımlar-I

Iina Hellsten
Amsterdam Üniversitesi İletişim Araştırmaları Okulu

Loet Leydesdorff
Amsterdam Üniversitesi, İletişim Araştırmaları Okulu

Sosyal medya verileri, büyük metinsel doküman setlerinin otomatik analizleri için gittikçe artan olanaklar sunmaktadır.  Bugüne kadar otomatik araçlar ya tartışmaya katılan katılımcılar arasındaki sosyal ağların ya da bu tartışmaların içeriklerinin analizleri için geliştirilmiştir. Sosyo-semantik ağlar olarak ele alınabilecek çevrim içi tartışmalarda aktörler (katılımcılar/participiant) ile konuların (içerik/content) ortak oluşumlarının (co-occur) haritalanmasına daha az ilgi gösterilmiştir. Çevrim içi tartışmaları anlamak ve görselleştirmek için; ortak ele alan konuların ve aktörlerin bütün matrislerini kullanan yeni, otomatik bir yaklaşım sunmaktayız. İki veri setini analiz ederek yeni yaklaşımın avantajlarını göstermekteyiz: İlki, 2012 Haziran’ındaki Rio 20 toplantısıyla ilgili geniş bir İngilizce Twitter iletileri seti (72.077 ileti) ve ikincisi de 2015-2017’deki kümes hayvanlarıyla alakalı kuş gribine dair küçük bir Hollandaca Twitter iletileri setidir (2.139 ileti). Yaklaşımımızın kuramsal, metodolojik ve somut etkileri ile diğer sosyal medya veri analizlerine uygulanmasını tartışmaktayız.

Giriş

Sosyal medya verileri sosyal bilimcilere çevrim içi tartışmalardaki karmaşık sosyal etkileşimlerin geniş bir metinsel derlemelerini sunmaktadır. Şimdiye kadar ağ araştırmasının iki ayrı kolunda nitel yöntemler ve otomatik araçlar geliştirilmiştir. Bir tarafta, aktörler ağına odaklanan aralarındaki ilişkiler ile yapıları haritalandıran sosyal ağ analizleri (Borgatti & Everett, 1997; Wasserman & Faust, 1994; Borgatti & Foster, 2003) diğer tarafta ise bu iletilerin içeriğini analiz etmek için kullanılan semantik ağ (anlam ağı) haritalama bulunmaktadır. Bunlar:

i) Ortak oluşan kelimelerin modellemesi bakımından içerik haritalama (content mapping)  (Danowski, 2012; Diesner, 2013),

ii) Konuları; kelimelerin ortak oluşum ağlarındaki kümelenmeleriyle saptama (Örneğin; Carley & Kaufer, 1993; Courtial, 1994; Danowski,2012; Diesner, 2013; Leydesdorff, 1989 ve Leydesdorff,1991),

iii) Kelime ortak oluşumundaki (word co-occurence) gizli yapıları yansıtan örtük çerçeveleme ((Hellsten, Dawson, & Leydesdorff,2010; Leydesdorff & Hellsten, 2005).

Her iki yaklaşım -sosyal ağ analizi ve semantik ağ analizi- sosyal medyadaki iletişime dair kısmi bir bakış sunmaktadır. Sosyal ve semantik ağların birleştirilmesi çevrim içi tartışmaları anlamak için daha kapsamlı bulgular sağlayabilir.  Tartışmalardaki aktörlerin ve konuların ortak oluşumlarını analiz etme zorluğu sosyal ve semantik ağ analizinden elde edilen fikirleri birleştirmeyi gerektirir. “Bütün matrisini (whole matrix)” kullanarak aktör-konu ağları haritalamaya dair bir yaklaşım sunmaktayız. Ayrıca Borgatti ve Everett’in (1997) 2-modlu ağ analizi yaklaşımına kıyasla bu yaklaşımın yararlarını tartışmaktayız. Yaklaşımımız sosyo-semantik ağları haritalamada hem ağ metodolojisi hem de kuramsal odağı bakımdan yenilikçidir. Bütün matris (whole matrix) yaklaşımı; bir bütünleşik tasarımda (integrated design) hem ayrışık (heterogeneous) hem de türdeş (homogeneous) düğüm (node) ve bağlantı (link) kümelerini haritalamamıza olanak sağlamaktadır. 

İlk olarak metodolojik açıdan sosyal ağ analizinde önde gelen iki parçalı ağın (bipartite network) temsili olarak 2-modlu matris yaklaşımını (Everet&Borgatti, 2013) geliştirmekteyiz. Tweetlerde bahsedilen aktörler ve konular matrisini dikkate almayı önermekte ve daha enformatif sonuçlar sağlamada bu yaklaşımın avantajlarını göstermekteyiz. Aktör-ağ kuramından (Latour, 1996) esinlenerek odağı sosyal aktörler ve onların semantiğinden hem aktör hem de konuların ortak ele alınmasına kaydırmaktayız. Sosyal ağ analizleri iletilerin yazarları ve yazarın bahsettiği aktörler arasındaki etkileşimle ilgilenmesine karşın, iletilerin içeriğinde bahsedilen  aktörler ve konular arasındaki etkileşime odaklanmaktayız. Odaktaki bu kayma; iletilerin yaratımı (authoring) olarak sosyal aktörlere daha az odaklanan ve konular bakımından ele alınan diğer aktörlere daha fazla odaklanan sosyal bilimde kuramı inşa etmek için yeni yollar açmaktadır.

Büyük ölçüde odağımız Twitter iletilerine dairdir ve etiketlerin ortak oluşumlarını (konuların temsilleri olarak) ve kullanıcı adlarını (adresli aktörler olarak) haritalamaktır. Ayrıca, tek görselleştirmede üç farklı düğüm tipinin (yazar, bahsedilen kişi/kurum ve konular) kullanıldığı 3 modlu yaklaşıma doğu bir genişleme göstermekteyiz. Özetle, kimin (hangi yazar) hangi kavramları (konuları) kullandığını sormaya ek olarak aktörlerin ve konuların iletişimde ortak oluşumları da sorulabilir. Bu araştırma sorusu; Aktör Ağ Kuramındaki (Actor Network Theory/ANT) aktörler ve konuları diğer taraftan semantik ve sosyo-semantik ağ analizini birleştirme çağrılarına dayanmaktadır.

Kuramsal Çerçeve: Ağ Yaklaşımı

Aktör Ağ Analizi (Actor Network Analysis/ANT); insan ve insan olmayan faillik (agency) arasındaki sosyal etkileşimlere dair ilişkisel perspektifi olarak 1980’lerin başından itibaren bilimin-sosyal-çalışmaları (social-studies-of-science) geleneği içinde geliştirilmiştir. Semiyotik gelenekte (göstergebilim) semantik ve sosyal ilişkiler “eyleyenler (actant)” olarak görülmektedir (Callon & Latour, 1981; Latour, 1996). Eyleyenler bir ağ ile ilgili insan veya insan olmayan failleri temsil edebilirler (Callon, 1986). Ayrıca hem insan hem de insan olmayan eyleyenler düşüncesine ek olarak, Aktör Ağ Kuramı (Actor Network Theory/ANT) sosyal ağ analiziyle benzer bir şekilde ağları kapsayıcı bir ilişkisel ve dinamik sosyal kuram kullanarak kuramlaştırmaktadır.

İnsan failleri arasındaki etkileşime odaklanan sosyal ağ analizinin tersine Aktör Ağ Kuramı insan olmayan faillere de odaklanmaktadır ve “belli bir öğenin; yönettiği bağlantı sayısıyla nasıl stratejik hale geldiğini ve bağlantılarını kaybettiğinde önemini nasıl kaybettiğini izlemeyi” (Latour, 1996, s. 372) amaçlamaktadır. Bizim yaklaşımımız sosyal medya tartışmalarında aktörler arasındaki sosyal ilişkilerin yerine bağlantıların gösterge sürecine (semiosis) odaklanmaktadır. Twitter iletişiminde eyleyenler olarak ele alınan kullanıcı adları (username) ve etiketleri (hashtag) analiz etmekteyiz. Kısaca, kimin hangi konuları ele aldığını değil kimin hangi konularla ortak ele aldığını sormaktayız.

Aşağıda iletişimin kökenindeki sosyal failleri “yazar (author)” ve iletişimde ele alınan aktörleri “bahsedilen (addressee)” olarak isimlendireceğiz. Aynı zamanda aktör ağ terminolojisindeki “eyleyenler (actants)” kavramı da, birlikte bahsedilen (co-adresses) konuları ve aktörleri ifade etmektedir.

Daha geniş ağ kuramına göre yaklaşımımızı konumlandırmak için öncelikle ağ analizlerinin iki kolunu tartışmaktayız. Bu iki kol -sosyal ağ analizi ve semantik, ortak kelime (co-word) analizi- temelde birbirinden bir adım uzunlukta geliştirilmiştir  (Ancak, bkz, Roth & Cointet, 2010; Roth, 2013). Anlamlı sosyo-semantik ağları kuramsallaştırmanın güçlüğü ve enformasyon bilimleri ile iletişim çalışmalarındaki ampirik araştırmaları nasıl değiştirebileceği veya zenginleştirebileceği aşikar bir sorun olarak kalmıştır.

Sosyal ağ analizinde;  “yazar” olarak nitelendirilen sosyal aktörler arasındaki etkileşimleri ölçümlendirmek için metodoloji, son on yirmi yıl içinde geliştirilmiştir ((Wasserman & Faust, 1994). Sosyal gruplara bağlı aktörlerin iki parçalı ağları (bipartite network); gruplara karşı aktörlerin 2 modlu bağlantı ağlarını sağlamaktadır (Breiger, 1974). Bilgisayar programları, önemli yazarları ağlardaki merkeziyetleri yönünden belirlemeyi mümkün hale getirmektedir. Sosyal ağ analizinde, sosyal yazarlar ve birbirleriyle ilişkilerinin yanı sıra yazarlar ve niteliklerinin iki parçalı matrisleri incelenmiştir (Borgatti & Everett, 1997). Buna karşın, bu metodoloji iletişimin semantik içeriğine erişim sağlamamaktadır.

İletişimin içeriği; 1990’ların başından beri akademinin giderek artan bir biçimde ilgisini çeken semantik ağ analizi (Landauer, Foltz, & Laham, 1998)  konusu olmuştur ((Leydesdorff, 1989; Leydesdorff, 1991; Leydesdorff, 1997). Özellikle -biri insan veya bilgisayar destekli kodlamanın önde olduğu ikincisi ise semantik ortak kelime haritaları için otomatikleşmiş analizlerin uygulandığı-  iki farklı gelenekçe. Örneğin; Carley ve Kaufer (1993); bu iki temsiliyetin çapraz döllenmeye ihtiyacı olduğunu iddia ederek sembollere odaklanan araştırma alanlarının semantik ağ analiziyle birleştirilmesine dikkat çekmektedirler.

Bilahare bu yaklaşım metin(ler)deki kelimeleri örneğin- bireysel isimler, kuruluş isimleri ve diğer alakalı kategoriler (Diesner, 2013) gibi kategorilere kodlamaya dayanan özel yazılım paketlerini kullanarak (Örneğin; AutoMap ve ORA) kavram ağlarının yapıları üzerinde sistematik araştırmayı ayrıntılandırmıştır.  

Özellikle, Diesner ve Carley (2005) semantik ağ analizine meta-matris yaklaşımı olarak tanımlanan bir yaklaşım önermişlerdir. Bu yaklaşım ve ilgili ORA yazılımı dört içerik ögesi arasında ayrımda bulunur: (i) Failler (agent), (ii) Bilgi kategorileri (iii) Kaynaklar ve (iv) süreçler veya görevler. Bu tasarımın amacı organizasyonlardaki dengesizliklere işaret etmektir. Yaklaşımımız nitelik matrislerini (attribute matrices) ayrıştırmaya odaklanırken teknik olarak meta-matris yaklaşımı bağlantılı matrisleri (affilition matrices) birleştirmektedir. Kanaatimize göre, iki yaklaşım analitik olarak farklıdır ve farklı amaçlara hizmet etmektedir. Oysaki semantik ağ analizi için meta-matris yaklaşımı veri temizleme ve elle veya kısmen otomatik, kelime destekli metinlerin kodlanmasını gerektirirken yaklaşımımız tamamen otomatiktir. Kodlama sonrasında, büyük metin setinin otomatik ağ analizi için meta-matris yaklaşımı kullanılabilir (Pfeffer & Carley, 2012). Bu yaklaşım, -bize göre- elle ve otomatik içerik analizi yelpazesini genişletmektedir.

Elle yapılan geleneksel içerik analizinde (Örneğin; Krippendorff, 1989) odak, bir kodlama şeması tasarlarken kodlayıcılar tarafından önceden oluşturulan belirli çerçeveler üzerindedir. Sonrasında; ortaya çıkan kavram ağları sonuçları (tek kelime ve/veya cümleden ibaret) metinlerdeki örtük veya ortaya çıkan anlamlar yerine kodlayıcının önemli kavramları yorumlamasını temsil eder. İlke olarak, bu tür sosyal-bilim-esinli metin analizleri bilişsel dilbilim (cognitive linguistic) gibi dil çalışmalarında geliştirilen nicel metotlarla oldukça benzerlik taşır (Sanders & Spooren, 2010).

Son dönemlerde, otomatik analizler hem içerik analizine hem de semantik ağ analizine uygulanmıştır. Otomatik içerik analizi; dokümanlarda inşa edilen aktörler ve konuları elle yapılan çağrışımsal çerçevelerle (associative frame) çıkarmaya odaklanmakta (Örneğin; Schultz, Kleinnijenhuis, Oegema, Utz& van Atteveldt, 2012) ve otomatik küme ve duygu analizi (sentiment analysis) kullanmaktadır (Örneğin; Burscher, Vliegenthart ve De Vreese, 2015). Faktör analizi bir kelime/doküman matrisini kullanarak otomatik konu analizinde kullanılmaktadır (Leydesdorff & Welbers, 2011; Vlieger ve Leydesdorff, 2011). Faktör analitik yaklaşımı; konuları saptamak için belirli konulara ait kelime atayarak (assign) ve konulardaki kelimelerin ortak oluşum kelimelerini belirleyerek kelime dağılımlarını kullanan konu modelleme (topic modelling)  ile karşılaştırılabilir. Özellikle olasılık dağılımlarını kullanarak kelimeleri kümelere atayan Latent Dirichlet Allocation (LDA) yöntemiyle (Blei, Ng ve Jordan, 2003).  Bu yöntem büyük doküman setlerinin analizine uygulanmıştır (Örneğin; Jacobi, van Atteveldt, & Welbers, 2016). 

Bir başka ağ semantik kolunda Leydesdorff ile Hellsten (2005) ve (2006), insan kodlaması olmadan metinsel dokümanlardaki örtük çerçeveleri açığa çıkarmak amacıyla otomatik semantik ortak oluşum kelime haritaları geliştirdi. Kelimeleri haritalamak için vektör-uzay modeli (vector-space model)  olarak da bilinen bu modelleme kelime/doküman matrislerine dayanmaktadır  (Salton ve McGill, 1983; Turney ve Pantel, 2010). Kelime/doküman matrisini kullanarak, sadece ortak oluşum kelime ikiliklerini dikkat almaz aynı zamanda tek kelimeleri, üçlüleri vb. de göz önünde tutar. Ayrıca ortak oluşum kelimeleri arasındaki ilişkilere ilaveten bu yöntem vektör uzaydaki kelimelerin konumlarını hesaba katabilir (Örneğin; bkz. Leydesdorff & Hellsten, 2005). Düğümler (nodes) bir ilişki olmaksızın eşdeğer konumlar işgal edebilirler.

Aktör Ağ Kuramına bir uygulama sunmasının yanında yaklaşımımız; sosyo-semantik ağ analizine geniş ölçüde uygulanabilecek metin dokümanlarında birlikte ele alınan (co-adresses) aktörler ve konuların otomatik analizini de sunmaktadır. İki düğüm tipli iki parçalı ağların yerine konular ve bahsedilenler (addressees) 2-modlu nitelik ağı (attribute of network) olarak temsil edilebildiğini yani kelimelerin iki türü ile birlikte (@kullanıcı adı ve #etiket) bir semantik ağ olduğunu savunmaktayız. Bir sonraki adımda, Aktör Ağ Analizi ontolojisinin ötesine geçilebilir ve etiketler, mesajların “yazarı” olamazken bahsedilenler, Twitter mesajlarının potansiyel yazarları olarak görülebilir. Bu meyanda, ontolojimiz Aktör Ağ Analizinden farklıdır.

Bütün-Matris Yaklaşımı (Whole-Matrix Approach)

Bütün-matris yaklaşımını aşağıdaki gibi işlevsel hale getirmekteyiz. Her bir tweet hem bahsedilen aktörlerin (@kullanıcı adları) hem de konuların (#etiketler) atfedildiği bir analizi birimi olarak düşünülebilir.  Ortaya çıkan kelimelere karşı dokümanlar matrisi asimetriktir. Ancak tek geçişle/single pass  (Devrik matrisin/transpose matrix çoğaltılmasıyla) hem etiketler ve hem de kullanıcı adlarının bağlantılı matrisi (affiliation matrix) yaratılabilir. Kullanıcı adlarına (nitelik olarak) karşı 2-modlu etiket matrisi bu matriste köşegen dışı (off-diagonal) altçizge (subgraph) olarak bulunurken ortak etiketler (co-hashtag) ve ortak-kullanıcı adı (co-username) matrisi ana köşegen boyunca konumlandırılır (Şekil 1 ve Şekil 2).

Şekil 1’deki matris; kütüphane ve enformasyon bilimi (Salton & McGill, 1983) yaygın olarak kullanılan sosyal ağ analizinde  (Borgatti & Everett, 1997) ve son dönemlerde semantik ağ analizindeki (Örneğin; Yang & González-Bailón, 2017) kelime/doküman matrisine benzemektedir. Şekil 2; aktörler ve konuların semantik ağları ile onların tek bir temsildeki ilişkilerini içeren bütün matrisini (whole matris) göstermektedir.

Sosyo-semantik ağ analizinde bütün matris (whole matrix) sonuçlarının iki parçalı 2-mod matrisi (bipartite 2-mode matrix) dayananlardan daha enformatif sonuçlar sunduğunu iddia etmekteyiz. İki parçalı yaklaşım (bipartite approach) sadece #etiket ağlarındaki @kullanıcı adını yakalarken özellikle bütün matris yaklaşımı (whole matris approach) hem etiket ağlarındaki @kullanıcı adını hem de @bahsetmedeki @bahsetmeyi veya #etiket ağlarındaki #etiketi yakalar.  


Köşegen dışı alt grafikler (off-diagonal subgraph); özgün yazarların tweette @bahsedilen diğer kullanıcıları etiketlere ekleme niyetlerini temsil etmektedir. Aşağıdaki sonuç bölümünde; ikiden fazla boyuta kıyasla bu ek seçeneğin artılarını ve muhtemel genişlemesini göstereceğiz. 
                                                                            
                                                                                                                    ./..

Yorumlar

Bu blogdaki popüler yayınlar

A’dan Z’ye Roland Barthes’in Mitoloji Teorisi : Mitlerin Eleştirel Teorisi - Andrew Robinson

Eleştirel Söylem Analizi: Sosyal Medyada Kuramlara Doğru-I - Connie S. Albert, A.F. Salam

Denizci Şarkıları (Sea Shanties) - Shamser Mambra