Twitter’da Aktör-Konu Ağlarının Otomatik Analizi: Sosyo-Semantik Ağ Analizine Yeni Yaklaşımlar-III

Tartışma ve Sonuç


Twitter ileti içeriklerinde kullanılan kelimeler yerine Twitter’a has  belirli #etiketler ve @kullanıcı adlarının  ortak oluşumlarına odaklanarak Twitter iletilerinin analizi için yeni yöntem önerilmiştir. Hangi kullanıcıların hangi konularla bağlantılı olarak ele alındığını haritalamayı mümkün hale getirmesi yaklaşımımızın sahip olduğu bir avantajdır. Yaklaşım, anlamlı yorumlamalar açısından muğlak kalan “kelime çantası (bags-of words)” üretmesi nedeniyle eleştirilen  semantik ağların sorununu çözmeye yardımcı olmaktadır. Özellikle etiket veya kullanıcı adlarından oluşan kümeleri de dahil ederek 2-modlu yaklaşımla kıyaslandığında bütün matris yaklaşımının daha eksiksiz sonuçlar sunmadaki avantajlarını gösterdik. İki parçalı 2-modlu matris böyle kümeleri yok sayma eğilimindedir.

Ayrıca, bütün matris yaklaşımı iki tip düğümden sonsuz mod (n-mod) ağlara (n>2) doğru analizin genişletilmesine olanak sağlamaktadır. Örneğin, analizi yazarların, aktörlerin ve etiketlerin 3-mod ağına genişlettik ve sonuçları tek bir görselleştirmede haritalandırdık (Şekil 7). Aktör Ağ Kuramını (Actor Network Theory/ANT) kullanarak, gönderen yazarlar da tweetin nitelikleri olarak düşünülebilir.  Bu semiyotik bakış açısı, araştırmacılara araştırma sorularına bağlı olarak çoklu düğüm tiplerine odaklanma fırsatları sunmaktadır.

Kuram inşa etmek için, ileti içeriklerinde kullanılan kelimelerin yerine etiketlerin ve kullanıcı adlarının haritalandırılması çevrim içi tartışmalara daha enformatif bakış sunmaktadır. Etiketlerle alakalı belirli aktörlerin ortak oluşumları/birliktelikleri, hangi aktörlerin hangi konularla birlikte ele alındıklarına dair enformasyon vermektedir. Bunun sonucu olarak, bağlantılar temelinde etiketleri ve aktörleri “eyleyen” olarak analiz ederek gerçekte de Aktör Ağ Kuramını geliştirmektedir (Latour, 1996). Aktör Ağ Kuramı bağlamında (Callon, 1986; Latour, 2005) bu sonuçlar, yazarlar arasındaki sosyal ağlara dayanmayacak bir biçimde metin dokümanlarını kullanarak sosyo-semantik ağların analizini otomatikleştirmeye dönük ilk adımlardır. Yaklaşımımız çevrim içi tartışmalarda aktörler ve konular arasındaki bağlantıları görünür hale getirmektedir. En aktif Twitter kullanıcılarına odaklanmayı gerektirmediğinden yaklaşımımız “eyleyenler” olarak birlikte ele alınan aktörler ve konuların ilişkilerini açıklayabilmektedir. Ampirik araştırmamızın yansımalarına dair daha fazla kuram inşa etmek gerekmektedir.

Daha önce hem çevrim dışı (Saint-Charles & Mongeau, 2018; Basov, Lee, & Antoniuk, 2017)  hem de çevrim içi iletişime (Roth, 2013; Roth ve Cointet, 2010) uygulanan sosyo-semantik ağların gelişmekte olan alanına; yaklaşımımız, hem küçük hem de büyük ölçekli veri setlerini birlikte ele alınan eyleyenler için anlamlı sonuçlar sağlayacak biçimde incelemeye yeni bir ampirik yöntem sunmaktadır. Bu, bildiğimiz kadarıyla aracılı iletişimlerde aktörlerin ve konuların nasıl birlikte ele alındığını araştırmaya dönük ilk otomatikleştirilmiş  çabadır.

Bunun yanında yaklaşımımız 1990’lardan beri (Borgatti & Everett, 1997) temel yöntemsel yaklaşım olarak sosyal ağ analizine uygulanan iki parçalı 2-modlu yaklaşımda bir gelişime işaret etmektedir. İki parçalı çizgelerin analizi için 2-modlu yaklaşımın faydalı olduğu kanıtlansa da -Örneğin; kelimelerin ve yazarların- aktörleri konularla birleştiren bütün matris yaklaşımının analiz için daha kapsamlı olduğu görünmektedir. Farklı veri seti türleriyle iki yaklaşımı karşılaştırmak için daha fazla kuramsal ve yöntemsel araştırmalara ihtiyaç bulunmaktadır.

Uygulama bakımından bu yaklaşımın ek avantajlarından biri, kelimelerin çoğul biçimlerinin, kelimelerin köklerinin analizden çıkarılması veya daha az anlamlı kelimelerin (Örneğin; “the”, “a”, “an”, “he”, “she”, “it” vb.) kaldırılması için etkisiz kelimeler listesi kullanma gibi veri temizleme işlemlerine gerek olmamasıdır. Herhangi bir temizlemeye ihtiyaç duyulmadan bütün etiketler ve kullanıcı adları anlamlı meta-veridir. Gelecekteki çalışmalar ayrıca iki yaklaşımın daha ayrıntılı karşılaştırması için etiket-kullanıcı ağlarıyla semantik ortak kelime ağlarını karşılaştırabilir. Rutinler de veri setinin boyutu ile sınırlı değildir. Bizim çalışmamızda, birkaç bin tweetten oluşan küçük veri seti ile yüz binden fazla twetten oluşan veri setine uygulanabildi. Bu sosyal medya tartışmalarına daha güvenilir bir aşağıdan yukarıya yaklaşıma olanak sağladı.
Sonuç olarak, yaklaşım, genel olarak haber medyası, sosyal medya ve kurumsal medyada aktörlerin birlikte bahsedilmesine odaklanarak paydaş analizinin yanı sıra konu alanlarını araştırmak gibi iletişim bilimlerinde geniş bir kuramsal gelenek yelpazesine uygulanabilir (Hellsten, Jacobs ve Wonneberger, 2019). Yöntemi, incelediğimiz Twitter iletilerine uygulamamıza karşın yaklaşım, örneğin konu başlıkları veya anahtar kelimelerin olduğu bilimsel yayınların metinlerinde, alıntı yapılan kullanıcı adları etiketler ve aktörler olarak görülebilir. Bilimsel makalelerdeki anahtar kelimelerden bir liste ve akademik yayınların içeriğinden de alıntı yapılan aktörlerin bir listesi çıkarılabilir. Bu listeler words.txt oluşturmak için kullanılabilir ve bu makalede sunulana benzer şekilde analiz edilebilir. Aynı zamanda tweetlerde hedeflenenler ile tweet yazarları arasındaki ilişkilere bakılacak bir sosyal ağ analiziyle de birleştirebilir. Bir adım ötesinde, yaklaşım başka metin tiplerini görselleştirerek analiz etmede kullanılabilir. Örneğin; Twitter iletilerindeki @kullanıcı adlarına benzer biçimde gazete makalelerinde bahsedilen kuruluş isimleri gibi. Alternatif olarak yaklaşım, @kullanıcı adları olarak bahsedilen aktör isimlerini ve #etiket olarak konu kategorilerini veya anahtar kelimelerini kullanarak bilimsel metinler için kullanılabilir.

Yöntemi daha geliştirmek, doğrulamak; tweet olmayan  ve # ve @ işaretlerini içermeyen metinlerin meta verisini içeren uygulamada en uygun yöntemin bulunması için daha fazla araştırmaya gereksinim bulunmaktadır. Bu ampirik araştırma, enformasyon ve iletişim bilimlerinde kuram inşasına geri dönüş yapabilir ve yazar temelli yaklaşımdan metin-temelli yaklaşıma kaymanın bir işareti olabilir.

Kaynakça

Ausserhofer, J. & Maireder, A. (2013). National politics on Twitter: Structures and topics of networked public sphere. Information, Communication & Society, 16(3), 291–314.
Basov, N., Lee, J.S. & Antoniuk, A. (2017). Social networks and construction of culture: A socio-semantic analysis of art groups. In Complex Networks & Their Applications (vol. 963, pp. 785–796).
Blei, D.M., Ng, A.Y., & Jordan, M.I. (2003). Latent Dirichlet allocation. Journal of Machine Learning Research, 3, 993–1022.
Borgatti, S.P. & Everett, M.G. (1997). Network analysis of 2-mode data. Social Networks, 19(3), 243–269.
Borgatti, S.P. & Foster, P.C. (2003). The network paradigm in organizational research: A review and typology. Journal of Management, 29(6), 991–1013.
boyd, d., Golder, S. & Lotan, G.. (2010). Tweet, tweet, retweet: Conversational aspects of retweeting on Twitter. In 2010 43rd Hawaii International Conference on System Sciences, Kauai, HI.
Breiger, R.L. (1974). The duality of persons and groups. Social Forces, 53(2), 181–190.
Bruns, A. & Burgess, J.E. (2011). The use of Twitter hashtags in the formation of ad hoc publics. In Proceedings of the 6th European Consortium for Political Research (ECPR) General Conference 2011. Reykjavik: University of Iceland.
Bruns, A. & Stieglitz, S. (2013). Towards more systematic Twitter analysis: Metrics for tweeting activities. International Journal of Social Research Methodology, 16(2), 91–108.
Burscher, B., Vliegenthart, R., & De Vreese, C. (2015). Framing beyond words: Applying cluster and sentiment analysis to news coverage of the nuclear power issue. Social Science Computer Review, 34(5), 530–545.
Callon, M. (1986). Some elements of a sociology of translation: Domestication of the scallops and the fishermen of St Brieuc Bay. In J. Law (Ed.), Power, action and belief: A new sociology of knowledge. London: Routledge & Kegan Paul.
Callon, M., Courtial, J.-P., Turner, W.A., & Bauin, S. (1983). From translations to problematic networks: An introduction to co-word analysis. Social Science Information, 22(2), 191–235.
Callon, M. & Latour, B. (1981). Unscrewing the big leviathan: How
actors macro-structure reality and how sociologists help them to do so.
In K.D. Knorr-Cetina & A.V. Cicourel (Eds.), Advances in social theory and methodology. Toward an integration of micro- and macro-sociologies (pp. 277–303). London: Routledge & Kegan Paul.
Carley, K.M. & Kaufer, D.S. (1993). Semantic connectivity: An approach for analyzing symbols in semantic networks.
Courtial, J.-P. (1994). Co-word analysis of scientometrics. Scientometrics, 31(3), 251–260.
Danowski, J.A. (2012). Analyzing change over time in organizations publics with a semantic network include list: An illustration with Facebook. In 2012 IEEE/ACM International Conference on Advances in Social Networks Analysis and Mining (pp. 954–959).
De Nooy, W., Mrvar, A., & Batagelj, V. (2011). Exploratory social network analysis with Pajek: Revised and expanded (2nd ed.). Cambridge, UK: Cambridge University Press.
Diesner, J. (2013). From texts to networks: Detecting and managing the impact of methodological choices for extracting network data from text data. Künstliche Intelligenz, 27(1), 75–78.
Diesner, J. & Carley, K.M. (2005). Revealing social structure from texts: Meta-matrix text analysis as a novel method for network text analysis. In V.K. Narayanan & D.J. Armstrong (Eds.), Causal mapping for information systems and technology research (pp. 81–108). Harrisburg, PA:Idea Group Publishing.
Enli, G. & Simonsen, C.A. (2017). Social media logic meets Professional norms: Twitter hashtags usage by journalists and politicians. Information, Communication & Society, 21, 1081–1096. https://doi.org/10.1080/1369118X.2017.1301515
Everett, M.G. & Borgatti, S.P. (2013). The dual-projection approach for two-mode networks. Social Networks, 35, 204–210.
Foot, A.K. & Schneider, S.M. (2006). Web campaigning. Cambridge,
MA, and London, UK: MIT Press.
Gerlitz, C. & Rieder, B. (2013). Mining one percent of Twitter: Collections, baselines, sampling. M/C Journal, 16(2). ISSN 14412616. Retrieved from http://journal.media-culture.org.au/index.php/mcjournal/article/view/620Rieder.
Hellsten, I., Dawson, J., & Leydesdorff, L. (2010). Implicit media frames; automated analysis of public debate on artificial sweeteners. Public Understanding of Science, 19(5), 590–608.
Hellsten, I., Jacobs, S., & Wonneberger, A. (2019). Active and passive
stakeholders in issue arenas: A communication network approach to
the bird flu debate on Twitter. Public Relations Review, 45(1),35–48.
Himelboim, I., Smith, M.A., Rainie, L., Shneiderman, B., & Espina, C.(2017). Classifying Twitter topic-networks using social network analysis. Social Media +Society, 3(1), 1–13.
Holmberg, K. & Hellsten, I. (2016). Twitter campaigns around the fifth IPCC report: Campaign spreading, shared hashtags, and separate communities. SAGE Open, 6(3).
Jacobi, C., van Atteveldt, W., & Welbers, K. (2016). Quantitative analysis of large amounts of journalistic texts using topic modelling. Digital Journalism, 4(1), 89–106.
Kamada, T. & Kawai, S. (1989). An algorithm for drawing general undirected graphs. Information Processing Letters, 31(1), 7–15.
Krippendorff, K. (1989). Content analysis. In E. Barnouw, G. Gerbner,
W. Schramm, T. L. Worth, & L. Gross (Eds.), International encyclopedia of communication (Vol. 1, pp. 403–407). New York, NY: Oxford University Press.
Landauer, T.K., Foltz, P.W., & Laham, D. (1998). An introduction to
latent semantic analysis. Discourse Processes, 25(2), 259–284.
Latour, B. (1996). On actor-network theory: A few clarifications. Soziale Welt, 47(4), 369–381.
Latour, B. (2005). Reassembling the social: An introduction to actor-network-theory. New York: Oxford University Press.
Leydesdorff, L. (1989). Words and co-words as indicators of intellectual organization. Research Policy, 18(4), 209–223.
Leydesdorff, L. (1991). In search of epistemic networks. Social Studies of Science, 21, 75–110.
Leydesdorff, L. (1997). Why words and co-words cannot map the development of the sciences. Journal of the American Society for Information Science, 48(5), 418–427.
Leydesdorff, L. & Hellsten, I. (2005). Metaphors and diaphors in science communication: Mapping the case of stem-cell research. Science Communication, 27(1), 64–99.
Leydesdorff, L. & Hellsten, I. (2006). Measuring the meanings of words in contexts: An automated analysis of “Monarch butterflies,” “Frankenfoods,” and “stem cells”. Scientometrics, 67(2), 231–258.
Leydesdorff, L. & Welbers, K. (2011). The semantic mapping of words and co-words in contexts. Journal of Informetrics, 5(3), 469–475.
Pearce, W., Holmberg, K., Hellsten, I., & Nerlich, B. (2014). Climate
change on Twitter: Topics, communities and conversations about the
2013 IPCC working group 1 report. PLoS One, 9(4), e94785.
Perez-Altable, L. (2015). The Arab Spring before the Arab Spring: A case study of digital activism in Tunisia. Global Media Journal (Arab Edition), 4(1–2), 19–32.
Pfeffer, J. & Carley, K.M. (2012). Rapid modeling and analyzing Networks extracted from pre-structured news articles. Computational Mathematic Organization Theory, 18, 280–299.
Roth, C. (2013). Socio-semantic frameworks. Advances in Complex Systems, 16(4 &5), 1350013.
Roth, C. & Cointet, J.-P. (2010). Social and semantic co-evolution in
knowledge networks. Social Networks, 32, 16–29.
Saint-Charles, J. & Mongeau, P. (2018). Social influence and discourse similarity networks in workgroups. Social Networks, 52, 228–237.
Salton, G. & McGill, M.J. (1983). Introduction to modern information
retrieval. Auckland, NZ: McGraw-Hill.
Sanders, T. & Spooren, W. (2010). Discourse and text structure. In D. Geeraerst & H. Cuykens (Eds.), The Oxford handbook of cognitive
linguistics. Oxford, UK: Oxford University Press.
Saxton, G.D., Niyirora, J.N., Guo, C., & Waters, R.D. (2015). #Advocating for change: The strategic use of hashtags in social media advocacy. Advances in Social Work, 16(1), 154–169.
Schultz, F., Kleinnijenhuis, J., Oegema, D., Utz, S., & van Atteveldt, W. (2012). Strategic framing in the BP crisis: A semantic network analysis of associative frames. Public Relations Review, 38(1), 97–107.
Thelwall, M. (2009). Introduction to webometrics: Quantitative web research for the social sciences. San Rafael, CA: Morgan & Claypool (Synthesis Lectures on Information Concepts, Retrieval, and Services (Vol. 1, No. 1).
Thelwall, M. & Cugelman, B. (2017). Monitoring Twitter strategies to
discover resonating topics: The case of the UNDP. El Profesional de la Información, 26(4), 649–661.
Van Eck, N.J. & Waltman, L. (2011). Text mining and visualization using VOSviewer. ISSI Newsletter, 7(3), 50–54.
Vlieger, E. & Leydesdorff, L. (2011). Content analysis and the measurement of meaning: The visualization of frames in collections of messages. Public Journal of Semiotics, 3(1), 28–50.
Wasserman, S. & Faust, K. (1994). Social network analysis: Methods and applications. New York: Cambridge University Press.
Yang, S. & González-Bailón, S. (2017). Semantic networks and applications in public opinion research. In J.N. Victor, A.H. Montgomery, & M. Lubell (Eds.), The Oxford handbook of political networks (pp. 327–353). New York, NY, USA. Oxford University Press.

Ek

TWEET.exe (https://leydesdorff.github.io/twitter adresinden ulaşılabilir) satırlar (tweet) ve kelimeler setinden kelime-belge oluşum matrisi, kelime ortak oluşum matrisi ve (isterseniz) normalleştirilmiş ortak oluşum matrisi yaratmaktadır. Çıktı dosyalarının (output file) istatistik analizi ve görselleştirmesi standart yazılımla (SPSS, UCInet/Pajek vb.) yapılabilir.

Girdi Dosyaları

Program iki enformasyona ihtiyaç duymaktadır. Bunlar: (a) ASCII formatında kelimeleri (değişkenler olarak) içeren “word.txt” dosya adı ve (b) Her satırında analizin metinsel birimlerinin (Örneğin; bir tweet) bulunduğu “text.txt” dosyasıdır. Satır sayısı sınırsızdır fakat her satır en fazla 4000 karakter içerebilir. Her satırın, iki satır boşluğu (hard carriage return)** ile sona erdirilmesi gerekmektedir. Dosya CR/LF*** ile birlikte düz metin olarak (plain text) Word’e veya Notepad gibi ASCII editörüne kaydedilmelidir. Kelime sayısı (değişkenler) 1024 ile sınırlıdır. Ancak çoğu programın (Örneğin; Excel) takipteki 256’dan fazla değişkenle işlem yapmanıza izin vermeyeceği akılda tutulmalıdır. Kelimeler, iki satır boşluğu ve yeni satır ile sona eren ayrılmış satırlarda olmalıdır (Kaydetmek için; dosya CR/LF ile birlikte düz metin olarak (plain text) Word’e veya Notepad gibi ASCII editörü kullanılmalıdır.)

  • Frwtwt.Exe ile birlikte kelimelerin sıklığı listesi oluşturulabilir. Program <text.txt>’i okur ve <stopword.txt> deki etkisiz kelimeler listesinin özelleştirilmesine olanak sağlar.


  • Stopword.txt 429 etkisiz kelimeyi içermektedir (http://www.lextek.com/manuals/onix/stopwords1.html adresinden ulaşılabilir). Her iki liste –kelimeler ve etkisiz kelimeler listesi-frqtwt.exe ile aynı klasörde bulunmalıdır. Program geçerli formdaki  (yani, çoğul kelimeler için düzeltmenin olmadığı) kelimeleri kontrol eder. stopword.txt de varsa, bu kelimeler dahil edilmez. 


  • Windows işletim sisteminde, Tweet.exee bir DOS-türü Komut Kutusunda çalışır ve girdi dosyaları –text.txt ve words.txt- aynı klasörde bulunmalıdır. Çıktı dosyaları da bu dizinin içine yazılır. Programın önceki çalışmalara ait dosyaların üzerine yazdığına dikkat ediniz. Materyallerle çalışmaya devam etmek isterseniz çıktıyı başka bir yere kaydedin.


Çıktı Dosyaları

Program üç çıktı dosyası yaratır. Daha ayrıntılı işlemler için Matrix.txt, Excel ve/veya SPSS programlarında açılabilir. “.dat” uzantılı iki dosya DL-formatındadır (ASCII) ve ağ analizi ile görselleştirme için Pajek veya UCInet kullanılabilir. Pajek http://mrvar.fdv.uni-lj.si/pajek/. adresinden ücretsiz indirilebilir.

a. matrix.txt metin içindeki kelimelerin ortak oluşumlu matrislerini içermektedir. Kelimeler ayrıca SPSS Syntax File labels.sps’de değişken adlarıdır. Matrix.txt, metin sihirbazı kullanılarak SPSS’de açılabilir ve sonrasında labels.sps çalıştırılabilir.

Matris asimetriktir: Değişkenler olarak kelimeleri ve vak’a olarak da tweetleri içerir. Diğer bir ifadeyle, metin numaralandırma sıralama düzeninde her satır bir tweeti ve kelime listesi sıralama düzeninde her sütun bir kelimeyi temsil etmektedir. (Analizden önce kelime listeni alfabetik olarak sıralamak isteyebilirsiniz.) Kelimeler her oluşum 1 ile frekans olarak sayılır.

b. cooc.dat, aynı veriden ortak oluşumlu kelime matrisini içerir. Bu matris simetriktir ve kelimeler hem değişkenler hem da satır etiketleri olarak bulunur. Ana köşegen sıfıra ayarlanır. Metinlerin her birinde ortak oluşum sayısı oluşum çarpanlarına eşittir. (Bu prosedür UCInet’deki rutin “bağlantılara (affiliation)” benzerdir lakin bu matriste ana köşegen sıfıra ayarlanır.) coocc.dot bu enformasyonu Pajek veya UCInet’in açtığı DL-formatında barındırır.

c. İsteğe bağlı olarak: cosine.dat aynı veride kosinüs-normalleştirilmiş kelime ortak oluşum matrisi içerir. Normalleştirme vektörler olarak kavramsallaştırılan değişkenler arasındaki kosinüse dayanır (Salton & McGill, 1983). (Prosedür, SPSS’deki rutin Proximity’e girdi olarak matrix.txt dosyası kullanmayla benzerdir.) cosine.dat dosyası bu enformasyonu Pajek formatında içerir. Düğümlerin boyutu ilgili kelimenin oluşum logaritmalarına eşittir. Pajek’de bu özellik açılabilir. Kosinüs değerlerine ihtiyaç yoksa running coocc.dbf ve coocc.dak çalıştırıldıktan sonra Tweet.exe durdurulabilir

* (Ç.N.) Boolean, değişken türünün doğru ya da yanlış olabileceği mantıksal veri tipidir.

** (Ç.N.) Hard Carriage Return: Enter tuşuna iki kez basılması

*** (Ç.N.) Herhangi bir web sitesinin içeriğini özel karakterler birbirinden ayrılması yani CR/LF, CRLF; Carriage Return satır başı, Line Feed yeni satır anlamına gelir.


* Yazı, aşağıdaki bağlantı adresinden alınarak çevrildi.

Özgün metni okumak için:



Yorumlar

Bu blogdaki popüler yayınlar

A’dan Z’ye Roland Barthes’in Mitoloji Teorisi : Mitlerin Eleştirel Teorisi - Andrew Robinson

Eleştirel Söylem Analizi: Sosyal Medyada Kuramlara Doğru-I - Connie S. Albert, A.F. Salam

Denizci Şarkıları (Sea Shanties) - Shamser Mambra