부정확한 데이터의 원인

2024년 9월 24일 화요일

Today I Learned

날짜

2024년 9월 24일 화요일

내용

데이터가 부정확한 이유

아임리포트의 결과물에서 데이터가 부정확하다. 어떤 규칙성이 존재하지 않은채, 중구 난방으로 틀려서 어딘지 감조차 안온다. 어떤 달은 데이터가 정확하기도 하다.. 우선 특정 광고그룹의 데이터가 누락되는 문제부터 손봤다.

계정 내의 캠페인, 그 캠페인에 포함되는 광고그룹들, 그 광고그룹 내에 포함되는 키워드들은 데이터베이스에 저장된다. 특정 유형의 광고그룹이 스프레드시트에 누락되었고, 데이터베이스를 확인해보니 데이터베이스 상에서도 없었다. 그 광고그룹들의 상위 캠페인은 포함되어 있었다. 비교적 최근 생성된 광고그룹이라서 누락된 문제인가? 싶어 다시 데이터를 날리고 추가해봤다. 그래도 여전히 같은 상황이다. 이 광고그룹들은 네이버에는 존재하지만 내 데이터베이스에는 저장되지 않는다.

네이버에서 캠페인부터 키워드까지 모두 불러오는 로직에 로깅문을 추가해 확인해봤다. 가져오는 캠페인은 총 84개인데, 27개까지만 불러오고 그 이후는 루프가 종료된다. 캠페인 데이터는 이상한게 없는데.. 한참을 뒤져본 결과, 어떤 광고그룹이 키워드를 가지고 있지 않을때 발생하는 문제였다. 이 작업은 3중 반복문이라 오류가 뜨면 아예 종료되지 않고, 다음으로 넘어가버리도록 작성되어 있었다. 키워드를 가지고 있지 않은 광고그룹을 탐색할 떄 오류가 발생했고 다음으로 넘어가버렸다. 이로 인해 일부 키워드 데이터가 저장되지 않고 있었다.

원인은 찾고 고쳤으니 내일 다시 데이터를 뽑아 비교해볼 예정.

회고

날씨가 시원해지니 참 좋다.