이 논문에서는 코드 스타일이 우수한 프로그래머를 식별하는 데 사용될 수 있는지 살펴봅니다. 이 연구는 Google 코드 잼 콘테스트의 C++ 솔루션을 대상으로 진행되었습니다. 스타일 클러스터가 존재하는지, 그리고 좋은 프로그래머가 스타일 클러스터에 속할 수 있는지 알아보기 위해 t-SNE 및 계층적 응집 클러스터링과 같은 클러스터링 기법을 사용했습니다. 4개의 스타일 클러스터가 발견되었지만, 우수한 프로그래머를 특정 클러스터와 연관시킬 수는 없었습니다. 그러나 지도 머신러닝은 스타일 속성을 사용하여 좋은 프로그래머를 예측할 수 있음을 보여주었습니다. 균형 잡힌 랜덤 포레스트는 0.650의 리콜, 0.511의 매크로-F1, 0.695의 AUC-ROC로 가장 좋은 결과를 도출했습니다. 이 결과는 코드 스타일..