Выявление иронии в текстах для сентиментального анализа

  • Базовый докторант, Андижанский государственный университет, Преподаватель-стажер, Наманганский государственный институт иностранных языков

DOI

https://doi.org/10.47689/2181-3701-vol2-iss4/S-pp95-104

Ключевые слова

анализ тональности / платформы социальных сетей / NLP / сарказм / алгоритмы глубокого обучения / обучение с несколькими задачами / полярность / токенизация

Аннотация

Человечество нашло множество способов выражения эмоций, которые, в зависимости от ситуации, могут сопровождаться сарказмом, особенно при передаче сильных чувств. За последние десятилетия социальные платформы, такие как Facebook, Instagram, TikTok, Twitter и YouTube, стали популярными каналами для выражения эмоций и личных размышлений широкой аудитории. С помощью методов анализа тональности эти данные находят применение в таких сферах, как бизнес, маркетинг, производство, анализ поведения и управление обществом в условиях экологических и биологических катастроф или военных конфликтов. Большинство современных исследований рассматривают анализ тональности и сарказма как две отдельные задачи текстовой классификации. В последние годы благодаря алгоритмам глубокого обучения удалось существенно повысить эффективность этих классификаторов. Однако одна из ключевых проблем заключается в том, что такие подходы часто не способны корректно классифицировать саркастические высказывания как негативные. В связи с этим мы утверждаем, что умение распознавать сарказм улучшает классификацию тональности и наоборот, поскольку эти задачи взаимосвязаны. В данной статье предложена модель на основе обучения с несколькими задачами (multi-task learning), использующая глубокие нейронные сети для моделирования взаимосвязи между классификацией тональности и сарказма, что повышает общую эффективность анализа тональности.

Библиографические ссылки

https://datareportal.com/reports/digital-2024-deep-dive-the-state-of-internet-adoption

Huang, C., Wang, Y., Li, X., Ren, L., Zhao, J., Hu, Y., Zhang, L., Fan, G., Xu, J., Gu, X., Cheng, Z., Yu, T., Xia, J., Wei, Y., Wu, W., Xie, X., Yin, W., Li, H., Liu, M., & Cao, B. (2020). Clinical features of patients infected with 2019 novel coronavirus in Wuhan China. The Lancet, 395(10223), 497–506. https:// doi. org/ 10. 1016/ s0140- 6736(20) 30183-5

American Psychological Association. (n.d.). APA: U.S. adults report highest stress level since early days of the COVID-19 pandemic. American Psychological Association. Retrieved October 6, 2022, from https:// www. apa. org/ news/ press/ releases/ 2021/ 02/ adults- stress- pandemic

Online Reviews Stats & Insights. Podium. (n.d.). Retrieved October 6, 2022, from https:// www. podium.com/ resources/ podium- state- of- online- reviews.

De Choudhury, Munmun, Counts, & Scott. (2012). The nature of emotional expression in social media: measurement, inference and utility. Human Computer Interaction Consortium (HCIC).

Zhao, J., Liu, K., & Xu, L. (2016). Sentiment analysis: Mining opinions, sentiments, and emotions. Computational Linguistics, 42(3), 595–598. https://doi. org/ 10. 1162/ coli_r_ 00259

Pang, B., & Lee, L. (2004). A sentimental education: Sentiment analysis using subjectivity summarization based on minimum cuts. In: Proceedings of the 42nd Annual Meeting on Association for Computational Linguistics–ACL ’04. https:// doi. org/ 10. 3115/ 12189 55. 12189 90

Turney, P. D. (2001). Thumbs up or thumbs down? Semantic orientation applied to unsupervised classification of reviews. Proceedings of the 40th Annual Meeting on Association for Computational Linguistics–ACL ’02. https:// doi. org/ 10. 3115/ 10730 83. 10731 53

Dave, K., Lawrence, S., & Pennock, D. M. (2003). Mining the peanut gallery: Opinion extraction and semantic classification of product reviews. In: Proceedings of the Twelfth International Conference on World Wide Web - WWW ’03. https:// doi. org/ 10. 1145/ 775152. 775226

Khadjeh Nassirtoussi, A., Aghabozorgi, S., Ying Wah, T., & Ngo, D. C. (2014). Text mining for market prediction: A systematic review. Expert Systems with Applications, 41(16), 7653–7670. https:// doi.org/ 10. 1016/j. eswa. 2014. 06. 009

Burnap, P., Williams, M. L., Sloan, L., Rana, O., Housley, W., Edwards, A., Knight, V., Procter, R., & Voss, A. (2014). Tweeting the terror: Modelling the social media reaction to the Woolwich terrorist attack. Social Network Analysis and Mining. https:// doi. org/ 10. 1007/ s13278- 014- 0206-4

Hogenboom, A., Heerschop, B., Frasincar, F., Kaymak, U., & de Jong, F. (2014). Multi-lingual support for lexicon-based sentiment analysis guided by semantics. Decision Support Systems, 62, 43–53. https:// doi. org/ 10. 1016/j. dss. 2014. 03. 004

O‘zbek tilining izohli lug‘ati sayt: https://izoh.uz/word/kinoya

Arunachalam, R., & Sarkar, S. (2013). The new eye of government: Citizen sentiment analysis in social media. In: Proceedings of the IJCNLP 2013 Workshop on Natural Language Processing for Social Media (SocialNLP), 23–28.

Diana, M., & MA, G. (2014). Who cares about sarcastic tweets? Investigating the impact of sarcasm on sentiment analysis. Lrec 2014 Proceedings.

Matsumoto, S., Takamura, H., & Okumura, M. (2005). Sentiment classification using word sub-sequences and dependency sub-trees. Advances in Knowledge Discovery and Data Mining. https:// doi.org/ 10. 1007/ 11430 919_ 37

Maas, A., Daly, R. E., Pham, P. T., Huang, D., Ng, A. Y., & Potts, C. (2011). Learning word vectors for sentiment analysis. Proceedings of the 49th Annual Meeting of the Association for Computational Linguistics: Human Language Technologies, 142–150.

Bespalov, D., Bai, B., Qi, Y., & Shokoufandeh, A. (2011). Sentiment classification based on supervised latent N-gram analysis. Proceedings of the 20th ACM International Conference on Information and Knowledge Management - CIKM ’11. https:// doi. org/ 10. 1145/ 20635 76. 20636 35

Abbasi, A., Chen, H., & Salem, A. (2008). Sentiment analysis in multiple languages: Feature selection for opinion classification in web forums. ACM Transactions on Information Systems, 26(3), 1–34. https:// doi. org/ 10. 1145/ 13616 84. 13616 8520. Yanagimoto, H., Shimada, M., & Yoshimura, A. (2013). Document similarity estimation for sentiment analysis using neural network. 2013 IEEE/ACIS 12th International Conference on Computer and Information Science (ICIS). https:// doi. org/ 10. 1109/ icis. 2013. 66078 25

Chen, T., Xu, R., He, Y., Xia, Y., & Wang, X. (2016). Learning user and product distributed representations using a sequence model for sentiment analysis. IEEE Computational Intelligence Magazine,11(3), 34–44. https:// doi. org/ 10. 1109/ mci. 2016. 25725 39

Abdi, A., Shamsuddin, S. M., Hasan, S., & Piran, J. (2019). Deep learning-based sentiment classification of evaluative text based on multi-feature fusion. Information Processing & Management, 56(4),1245–1259. https:// doi. org/ 10. 1016/j. ipm. 2019. 02. 018

Kumar, A., Srinivasan, K., Cheng, W.-H., & Zomaya, A. Y. (2020). Hybrid context enriched deep learning model for fine-grained sentiment analysis in textual and visual semiotic modality social data. Information Processing & Management, 57(1), 102141. https:// doi. org/ 10. 1016/j. ipm. 2019. 102141

Yafoz, A., & Mouhoub, M. (2021). Sentiment analysis in Arabic social media using deep learning models. 2021 IEEE International Conference on Systems, Man, and Cybernetics SMC. https:// doi. org/10. 1109/ smc52 423. 2021. 96592 45

Yousif, A., Niu, Z., Chambua, J., & Khan, Z. Y. (2019). Multi-task learning model based on recurrent convolutional neural networks for citation sentiment and purpose classification. Neurocomputing, 335,195–205. https:// doi. org/ 10. 1016/j. neucom. 2019. 01. 021

Yunitasari, Y., Musdholifah, A., & Sari, A. K. (2019). Sarcasm detection for sentiment analysis in Indonesian tweets. IJCCS Indonesian Journal of Computing and Cybernetics Systems, 13(1), 53.https:// doi. org/ 10. 22146/ ijccs. 41136

Загрузки

12 4

Опубликован

Как цитировать

Рахимов , Х. 2024. Выявление иронии в текстах для сентиментального анализа. Зарубежная лингвистика и лингводидактика. 2, 4/S (окт. 2024), 95–104. DOI:https://doi.org/10.47689/2181-3701-vol2-iss4/S-pp95-104.

Выпуск

Раздел

Лингвистика и межкультурная коммуникация