We can work IT out2016.04.14 14:54

이틀 전에 19대 국회의원 의결 성향에 대한 분석을 공개했었습니다. 정당은 빨강과(여) 나머지 파랑/초록/노랑이(야) 위/아래로 갈려있는 반면 의결 성향은 왼쪽/오른쪽으로 나뉘어있음을 보였었죠.

오늘은 어제 20대 국회의원 지역구 당선자를 19대 국회 의결성향에 그려봤습니다. 19대 국회의원들 중 20대에 당선된 사람들의 의결성향이 어느쪽일까 궁금했기 때문입니다. 그 결과 극 왼쪽 일부와 오른쪽 다수가 20대 국회에 재선되었음을 보게 됩니다.

그림에서 흐릿하게 표시된 사람들은 공천을 못 받았거나 20대 국회에서 낙선한 사람들 입니다. 출마자를 대상으로 낙선과 당선을 따지지 않고 단순히 당선자 목록을 19대 국회의원과 교집합 시켰기 때문에 각 당의 공천 성향이 상당 수 반영되었을 수도 있습니다.





저작자 표시 비영리 변경 금지
크리에이티브 커먼즈 라이선스
Creative Commons License
Posted by Lyle
We can work IT out2016.04.12 12:04

선거공보물이 도착했습니다. 모든 후보들이 낯설기만 합니다. 제가 19대 국회의원 선거에서 지지하여 당선됐던 후보는 20대 국회의원 선거에 나오질 않았습니다. 입후보한 사람들에 대한 공부를 해야 합니다. 지지하는 정당은 있습니다. 그러나 정당을 지지한다고 무작정 그 정당의 후보를 지역구 국회의원으로 뽑을 수는 없습니다. 무조건 기피하고 싶은 정당이 있지만 가끔 보면 그 정당에도 괜찮은 입후보자가 있을 수 있

고, 반대로 지지하는 정당에도 보기 싫은 정치인이 있기 때문입니다.


그래서 생각하길, 국회의원을 다시 분류해보기로 했습니다. 예를 들어 새누리당 안에서도 친박이 있고 반박이 있다고 하듯 서로 성향이 다르고 그만큼 의정활동도 다르게 했을 것 같습니다. 또한 그런 성향과 의정활동 내용은 같은 정당 내 국회의원들보다 다른 정당의 국회의원과 유사성을 갖을 수도 있겠다는 생각입니다.


19대 국회 의안들 중 표결이 이뤄진 것들을 취합했습니다. 데이터는 국회정보시스템, 참여연대 열려라국회, 그리고 포커 등의 사이트에서 크롤링 혹은 마이닝 했습니다. 수집한 의안 표결 건수는 총 1739건 입니다. 이중 찬성표가 330,489개, 반대표가 172,823개, 기권을 포함한 그외 표가 4,476개 입니다. 4,476개 중에는 표결에 참여한 국회의원의 명시적인 기권표도 있지만 불참 또는 결석 등도 다수 있는데, 모두 기권으로 분류했습니다.


현재 시점에서 국회의원은 292명입니다. 그런데 의안 표결 결과는 항상 292명이 아니고 또 도중에 표결 국회의원이 바뀌기도 합니다. 19대 국회 도중에 의원직을 상실한 사람들도 있고 보궐선거로 중간에 국회에 입성한 사람들도 있기 때문입니다. 이런 사람들의 경우 의정활동을 하지 않은 시점의 표결 결과가 기권으로 분류됐기 때문에 노이즈로 작용합니다. 그러나 전체 중 작은 일부이므로 노이즈를 무시했고, 의원직을 상실했거나 보궐로 당선된 국회의원의 경우 결과에서 그 사연을 감안해서 보면 되겠습니다.


아래 그림은 국회의원별 의안 표결 결과를 찬성, 반대, 기권으로 분류해서 두개의 클러스터로 재분류한 것입니다. 클러스터링 방법은 K-means 를 사용했고 PCA 를 사용해 1739차원의 벡터를 2차원으로 줄여 화면에 표시했습니다. 각 점은 국회의원 한 명을 나타냅니다. 이 점들은 정당과 상관 없이 하나의 의안에 대해 같은 내용의 투표를 많이 할 수록 점은 서로 가까이 표시됩니다. 반대로 어떤 의안에 대해 서로 다른 내용의 투표를 많이 한 점들은 서로 멀리 표시 됩니다.


그림1. 2개로 클러스터링된 19대 국회의원 성향


파란색(cluster0)과 주황색(cluster1)은 각 군집의 중심(센트로이드)에서의 거리를 기준으로 분류된 것 입니다. 군집의 경계에 있는 점들은 분류하기 애매한 경우로 볼 수도 있고 군집의 좌우 양 극단에 있는 경우 훨씬 더 성향이 대조적인 것으로 볼 수 있죠. 그런데 이런 표결 성향은 무조건 여당과 야당으로 나뉘어지지 않는 걸 아래 표에서 볼 수 있습니다. 


정당명국민의당더불어민주당무소속민주당새누리당정의당
cluster#

0 파랑

1584911075
1 주황61920440


위 표는 정당별로 파란색(황cluster0)과 주황색(cluster1)으로 분류된 수를 표시한 것입니다. 파란색 분류(cluster0)에는 다수의 국회의원들이 속해 있습니다. 이 분류 안에 더불어민주당과 새누리당은 잘 협력하고 있는 모습니다. 또한 정의당은 한가지 성향으로만 단결되어 있는데, 이들을 진보성향이라고 레이블링 한다면 나머지 정당들의 국회의원들 상당수가 정의당 의원들처럼 진보적인 표결을 했다고 볼 수도 있겠습니다.


반대로 정의당 의원이 존재하지 않는 주황색 cluster1 에는 새누리당 국희의원 중 1/3에 해당하는 44명이 포진해있습니다. 정의당의 진보적 성향에 반한 이 군집을 보수성향이라고 레이블링 한다면 더불어민주당의 19명 국회의원들도 이들과 비슷한 보수 성향을 갖고 있다고 읽을 수 있겠죠.



그림2. 국회의원 성향 클러스터링 결과에 정당명과 국회의원 이름 레이블링


이번에는 각 점에 해당하는 국회의원의 이름을 표시해봤습니다. 각당의 대표색깔에 맞춰 새누리당은 빨간색, 더불어민주당은 파란색, 국민의당은 녹색, 정의당은 노란색, 그리고 무소속(11명)과 민주당(1명)은 회색입니다. 표결 성향은 좌우로 나뉘어있는데, 그 위에 당의 색깔을 표시해보니 상하로 나뉘어진 것이 흥미롭습니다. 더불어민주당, 국민의당, 정의당 소속 국회의원은 거의 다 아래편에 군집했고 새누리당은 윗편으로 갈리면서 야와 여의 성향이 서로 다름을 확인할 수 있습니다.


혹시 20대 국회의원선거에서 자신의 지역구에 출마한 19대 현직 국회의원이 있다면, 그런데 그 국회의원의 성향이나 의정활동을 잘 알지 못한다면 위 플롯을 약간 참고하셔도 좋겠습니다. 해당 출마자의 이름을 찾고 그 주변에 자신이 타지역구이건 타정당이건 상관 없이 자신이 지지하는 국회의원이 있다면 눈여겨볼만한 가치가 있을지도 모릅니다. 혹은 거꾸로 평소 자신이 지지하던 국회의원의 이름을 먼저 찾고 그 국회의원 주변에 어떤 의원들이 있는지 살펴보는 것도 좋겠습니다.




저작자 표시 비영리 변경 금지
크리에이티브 커먼즈 라이선스
Creative Commons License
Posted by Lyle