충청투데이 충북 총선 후보 빅데이터 분석
소셜 메트릭스 BIZ 활용
검색어·연관어·감성분석

[충청투데이 심형식 기자] 충청투데이가 4·15 총선을 앞두고 도내 각 선거구 유력 후보들을 대상으로 SNS와 각종 온라인 플랫폼을 대상으로 ‘빅데이터 분석’을 실시했다.

빅데이터 분석은 ‘공직선거법’의 선거에 관한 여론조사 및 그 결과와 다르다. 거론 건수가 많다고 그 후보의 지지율이 높은 것은 아니며 따라서 당선가능성을 예측할 수 있는 것도 아니다. 다만 코로나19로 대면이 어려워지면서 온라인 선거운동의 중요성이 강조되는 현 시점에서 후보들에 대한 연관어, 감성분석 등을 통해 온라인 상에서의 흐름은 참고할 수 있다. 이번 빅데이터 분석은 다음소프트에서 제공하는 ‘소셜 메트릭스 BIZ’를 활용했다. ‘소셜 메트릭스 BIZ’는 트위터, 네이버 블로그, 커뮤니티, 인스타그램, 네이버 뉴스를 분석해 자료를 제공한다.

이번 분석은 도내 각 선거구별 주요 후보를 검색어로 해 거론 추이, 검색어와 함께 언급된 연관어, 연관어에 대한 감성 표현들을 긍정·중립·부정으로 판별한 감성 분석에 대해 진행했다.

최근 많이 사용되는 유튜브는 아직 수집 서비스가 이뤄지지 않고있다. 페이스북은 공개된 페이지만 법적으로 수집·활용이 가능한데 개인은 비공개처리가 많아 수집대상에서 제외됐다.

빅데이터 분석은 여론조사와 다르지만 최대한 공정성을 유지하기 위해 도내 각 선거구를 대상으로 같은 조건으로 검색을 실시했다. 검색 방법은 각 후보의 이름을 검색어로 하고 ‘후보’와 ‘각 선거구 명칭’, ‘당명’을 포함어로 사용했다. 포함어는 ‘or’로 검색했다. 동명이인으로 인한 데이터 오류를 예방하기 위해서다. 검색기간은 3월 9일부터 4월 9일까지 한 달간이다. 보도는 10일 청주권 4개 선거구, 13일 비청주권 4개 선거구다. 심형식 기자 letsgohs@cctoday.co.kr

저작권자 © 충청투데이 무단전재 및 재배포 금지