DOI
https://doi.org/10.47689/2181-3701-vol2-iss4/S-pp95-104Ключевые слова
анализ тональности / платформы социальных сетей / NLP / сарказм / алгоритмы глубокого обучения / обучение с несколькими задачами / полярность / токенизацияАннотация
Человечество нашло множество способов выражения эмоций, которые, в зависимости от ситуации, могут сопровождаться сарказмом, особенно при передаче сильных чувств. За последние десятилетия социальные платформы, такие как Facebook, Instagram, TikTok, Twitter и YouTube, стали популярными каналами для выражения эмоций и личных размышлений широкой аудитории. С помощью методов анализа тональности эти данные находят применение в таких сферах, как бизнес, маркетинг, производство, анализ поведения и управление обществом в условиях экологических и биологических катастроф или военных конфликтов. Большинство современных исследований рассматривают анализ тональности и сарказма как две отдельные задачи текстовой классификации. В последние годы благодаря алгоритмам глубокого обучения удалось существенно повысить эффективность этих классификаторов. Однако одна из ключевых проблем заключается в том, что такие подходы часто не способны корректно классифицировать саркастические высказывания как негативные. В связи с этим мы утверждаем, что умение распознавать сарказм улучшает классификацию тональности и наоборот, поскольку эти задачи взаимосвязаны. В данной статье предложена модель на основе обучения с несколькими задачами (multi-task learning), использующая глубокие нейронные сети для моделирования взаимосвязи между классификацией тональности и сарказма, что повышает общую эффективность анализа тональности.
Библиографические ссылки
https://datareportal.com/reports/digital-2024-deep-dive-the-state-of-internet-adoption
Huang, C., Wang, Y., Li, X., Ren, L., Zhao, J., Hu, Y., Zhang, L., Fan, G., Xu, J., Gu, X., Cheng, Z., Yu, T., Xia, J., Wei, Y., Wu, W., Xie, X., Yin, W., Li, H., Liu, M., & Cao, B. (2020). Clinical features of patients infected with 2019 novel coronavirus in Wuhan China. The Lancet, 395(10223), 497–506. https:// doi. org/ 10. 1016/ s0140- 6736(20) 30183-5
American Psychological Association. (n.d.). APA: U.S. adults report highest stress level since early days of the COVID-19 pandemic. American Psychological Association. Retrieved October 6, 2022, from https:// www. apa. org/ news/ press/ releases/ 2021/ 02/ adults- stress- pandemic
Online Reviews Stats & Insights. Podium. (n.d.). Retrieved October 6, 2022, from https:// www. podium.com/ resources/ podium- state- of- online- reviews.
De Choudhury, Munmun, Counts, & Scott. (2012). The nature of emotional expression in social media: measurement, inference and utility. Human Computer Interaction Consortium (HCIC).
Zhao, J., Liu, K., & Xu, L. (2016). Sentiment analysis: Mining opinions, sentiments, and emotions. Computational Linguistics, 42(3), 595–598. https://doi. org/ 10. 1162/ coli_r_ 00259
Pang, B., & Lee, L. (2004). A sentimental education: Sentiment analysis using subjectivity summarization based on minimum cuts. In: Proceedings of the 42nd Annual Meeting on Association for Computational Linguistics–ACL ’04. https:// doi. org/ 10. 3115/ 12189 55. 12189 90
Turney, P. D. (2001). Thumbs up or thumbs down? Semantic orientation applied to unsupervised classification of reviews. Proceedings of the 40th Annual Meeting on Association for Computational Linguistics–ACL ’02. https:// doi. org/ 10. 3115/ 10730 83. 10731 53
Dave, K., Lawrence, S., & Pennock, D. M. (2003). Mining the peanut gallery: Opinion extraction and semantic classification of product reviews. In: Proceedings of the Twelfth International Conference on World Wide Web - WWW ’03. https:// doi. org/ 10. 1145/ 775152. 775226
Khadjeh Nassirtoussi, A., Aghabozorgi, S., Ying Wah, T., & Ngo, D. C. (2014). Text mining for market prediction: A systematic review. Expert Systems with Applications, 41(16), 7653–7670. https:// doi.org/ 10. 1016/j. eswa. 2014. 06. 009
Burnap, P., Williams, M. L., Sloan, L., Rana, O., Housley, W., Edwards, A., Knight, V., Procter, R., & Voss, A. (2014). Tweeting the terror: Modelling the social media reaction to the Woolwich terrorist attack. Social Network Analysis and Mining. https:// doi. org/ 10. 1007/ s13278- 014- 0206-4
Hogenboom, A., Heerschop, B., Frasincar, F., Kaymak, U., & de Jong, F. (2014). Multi-lingual support for lexicon-based sentiment analysis guided by semantics. Decision Support Systems, 62, 43–53. https:// doi. org/ 10. 1016/j. dss. 2014. 03. 004
O‘zbek tilining izohli lug‘ati sayt: https://izoh.uz/word/kinoya
Arunachalam, R., & Sarkar, S. (2013). The new eye of government: Citizen sentiment analysis in social media. In: Proceedings of the IJCNLP 2013 Workshop on Natural Language Processing for Social Media (SocialNLP), 23–28.
Diana, M., & MA, G. (2014). Who cares about sarcastic tweets? Investigating the impact of sarcasm on sentiment analysis. Lrec 2014 Proceedings.
Matsumoto, S., Takamura, H., & Okumura, M. (2005). Sentiment classification using word sub-sequences and dependency sub-trees. Advances in Knowledge Discovery and Data Mining. https:// doi.org/ 10. 1007/ 11430 919_ 37
Maas, A., Daly, R. E., Pham, P. T., Huang, D., Ng, A. Y., & Potts, C. (2011). Learning word vectors for sentiment analysis. Proceedings of the 49th Annual Meeting of the Association for Computational Linguistics: Human Language Technologies, 142–150.
Bespalov, D., Bai, B., Qi, Y., & Shokoufandeh, A. (2011). Sentiment classification based on supervised latent N-gram analysis. Proceedings of the 20th ACM International Conference on Information and Knowledge Management - CIKM ’11. https:// doi. org/ 10. 1145/ 20635 76. 20636 35
Abbasi, A., Chen, H., & Salem, A. (2008). Sentiment analysis in multiple languages: Feature selection for opinion classification in web forums. ACM Transactions on Information Systems, 26(3), 1–34. https:// doi. org/ 10. 1145/ 13616 84. 13616 8520. Yanagimoto, H., Shimada, M., & Yoshimura, A. (2013). Document similarity estimation for sentiment analysis using neural network. 2013 IEEE/ACIS 12th International Conference on Computer and Information Science (ICIS). https:// doi. org/ 10. 1109/ icis. 2013. 66078 25
Chen, T., Xu, R., He, Y., Xia, Y., & Wang, X. (2016). Learning user and product distributed representations using a sequence model for sentiment analysis. IEEE Computational Intelligence Magazine,11(3), 34–44. https:// doi. org/ 10. 1109/ mci. 2016. 25725 39
Abdi, A., Shamsuddin, S. M., Hasan, S., & Piran, J. (2019). Deep learning-based sentiment classification of evaluative text based on multi-feature fusion. Information Processing & Management, 56(4),1245–1259. https:// doi. org/ 10. 1016/j. ipm. 2019. 02. 018
Kumar, A., Srinivasan, K., Cheng, W.-H., & Zomaya, A. Y. (2020). Hybrid context enriched deep learning model for fine-grained sentiment analysis in textual and visual semiotic modality social data. Information Processing & Management, 57(1), 102141. https:// doi. org/ 10. 1016/j. ipm. 2019. 102141
Yafoz, A., & Mouhoub, M. (2021). Sentiment analysis in Arabic social media using deep learning models. 2021 IEEE International Conference on Systems, Man, and Cybernetics SMC. https:// doi. org/10. 1109/ smc52 423. 2021. 96592 45
Yousif, A., Niu, Z., Chambua, J., & Khan, Z. Y. (2019). Multi-task learning model based on recurrent convolutional neural networks for citation sentiment and purpose classification. Neurocomputing, 335,195–205. https:// doi. org/ 10. 1016/j. neucom. 2019. 01. 021
Yunitasari, Y., Musdholifah, A., & Sari, A. K. (2019). Sarcasm detection for sentiment analysis in Indonesian tweets. IJCCS Indonesian Journal of Computing and Cybernetics Systems, 13(1), 53.https:// doi. org/ 10. 22146/ ijccs. 41136