주인장 이야기/유튜브이야기

#3 유튜브 알고리즘의 전부를 공개합니다 - 유튜브 세달째 정리

남보르 2019. 5. 27.

알다가도 모를 유튜브?! - 유튜브로 보기 클릭

이제 유튜브를 시작한지도 3달째가 되었습니다. 구독자는 540명 정도가 되었습니다. 첫달째 약 200명 두달째에 400명을 찍은 것 치고는 오히려 성장세가 느려졌습니다. 


원인은 OLED 이야기들의 주제가 조금 깊어졌기 때문에 당최 조회수가 안나오는게 문제인 것 같습니다. 유튜브는 확실히 전문분야로 승부를 볼 플랫폼이 아닌것같습니다.


왜냐하면 그 이유가 오늘 다룰 유튜브 알고리즘 분석의 결과로도 반영이 됩니다. 유튜브 알고리즘은 어떠한 영상의 조회수를 늘려주는지 모두가 따라할 수 있는 수준에서 알아보도록 하겠습니다.


먼저 이 분석을 시작하기 전에는 제 블로그 하루 방문자가 천명은 무조건 넘으니까 그래도 유튜브로 어느정도 유입될 것이라고 예측했던 제가 크~~~~~~~~은 잘못이었습니다. 유튜브는 그냥, 무조건, 절대적으로 사람들이 몰리는 주제를 하는 것이 맞습니다. 이 이야기는 모아서 한번에 정리를 해보도록 하고 이번달에 새로 분석한 알고리즘 들에 대해 정리를 해보겠습니다. 


제가 말하고자 하는 유튜브 알고리즘이란 과연 어떤 영상을 유튜브는 밀어주는가에 대한 분석입니다.


유튜브 알고리즘에 관심이 있으신 분들은 이번 글은 꼭!꼭! 읽으셔야 합니다. 그 동안의 글로된 "썸네일을 이쁘게 만들어라" "제목을 잘지어라" 이런 말도안되는 내용이 아닌 현제까지의 제 채널 실데이터로 정리한 알고리즘과 여러분들의 채널의 성격이 어떠한지 분석하는 방법에 대해 정리해보겠습니다.


첫번째, 유튜브 영상의 성격 분류 테스트

이번달까지 다양한 형태의 동영상들을 업로드하면서 테스트를 해보았습니다. 다분히 의도적으로 그렇게 만들었고 의도한 방향대로 흘러간 것도 있고 그렇지 않은 경우도 있었습니다.


1. 영상이 길며 지루한 영상 (10분 근처에 원론적인 관심 외 영상)
2. 영상이 길지만 좋은 정보 영상 (10분 근처에 정보 질이 높은 영상)

3. 영상이 길지만 대중적인 영상 (10분 근처에 토크 영상)


4. 영상이 짧으며 쓸데없는 영상 ( 5분 내외로 내가봐도 쓰레기 영상)
5. 영상이 짧으며 좋은 정보 영상 (5분 내외로 정보 질이 높은 영상)

6. 영상이 짧으며 대중적인 영상 (5분 내외로 전문정보가 아닌 대중적인 영상)


7. 썸네일에 내 사진이 있는 영상
8. 썸네일이 화려한 영상
9. 썸네일이 무미건조한 영상


이렇게 아홉가지 형태로 나누어서 테스트를 해보았는데 놀라운 것은 이런 카테고리 분류로는 도저히 답을 내릴 수 없는 이상한 결과가 도출되었습니다. 흔히들 말하는 


"유튜브는 복잡계이다" 


라는 말은 이렇게 카테고리를 나누어보니 더 와닿았습니다. 


그러면 위와 같은 카테고리 분석으로는 결과를 내릴 수 없었으니

(결과를 내릴 수 없었다는 이야기는 결과가 혼재되어 있어서 어떤 것이 중요한 팩터라고 콕 찝어내기 어렵다는 것을 의미합니다) 


다른방법으로 분석을 해보도록 하겠습니다. 


분석방법이 궁금하지 않는 분들은 패스하고 아래 결론만 보셔도 됩니다.


두번째, 유튜브 스튜디오 베타를 이용한 분석방법


<사진1. 남보르TV 유튜브 스튜디오 베타 통계 데이터 일부>


위 사진1은 제 유튜브 채널의 통계 데이터입니다. 다들 많이들 참고하실텐데요. 사실상 유튜브에서 제공하는 데이터는 이게 다 입니다. 물론 어떻게 들어왔는지 무슨 플랫폼으로 시청했는지 등등의 상세한 데이터도 공개하고 있지만 대세를 분석하는데는 큰 이점은 없으므로 위 사진1에 있는 데이터들을 주물러서 결과를 내보겠습니다.


먼저 위 사진같이 채널분석에 들어가셔서 평균 조회율, 평균 시청 지속 시간을 추가하여 데이터를 준비해줍니다.


1. 데이터 구글 스프레드 시트로 빼오기



그리고는 위 사진과 같이 구글 스프레드시트(새탭)을 눌러서 데이터를 구글 스프레드시트로 빼옵니다. 제 채널은 세달정도 운영했으므로 지난 90일 간의 데이터로 분석을 해보겠습니다.


그러면 아래 그림과 같이 엑셀과 모양이 비슷한 시트가 하나 나옵니다. 이걸 엑셀에다 붙여넣기로 가져와서 각각 열 이름을 아래와 같이 시청시간 조회수 평균시청지속시간 등으로 보기 좋게 바꾸어 줍니다.




2. 엑셀에서 분석준비하기 (제가 썼던 엑셀 파일 - 유튜브 분석.xlsx



위 사진과 같이 시청시간, 조회수 등을 가로세로로 동일한 순서로 맞추어 표를 하나 만들어 줍니다. 여기까지 만들었으면 이제 거의 작업은 끝난겁니다. 


그 다음은 아래 사진과 같이



시청시간 : 시청시간 셀을 위 함수 =CORREL(x, y) 함수를 사용해서 위 사진과 같이 바꾸어 줍니다. 여기서 행번호는 각자 채널에 맞게 조정해야겠죠? 제 채널같은 경우에는 21개 영상이 있으므로 C2~C23번까지로 범위를 정했습니다.


그리고 나서 쭉 계산을 알아서 시킬것이므로 행과 열을 F4를 눌러서 위 그림과 같이 고정시킵니다. 거기서 엔터를 치면 결과가 1이 나올겁니다. 1이 안나오시는 분들은 뭔가 잘못하신거니깐 다시 해보시기 바랍니다.


여기서 그럼 우리가 무슨 작업을 하고 있는 건지 알아보겠습니다. 우리는 CORREL 함수 즉, 상관지수 함수를 써서 각 항들의 데이터가 얼마나 상관관계가 있는지 알아보는 겁니다.


3. Correl 함수의 결과의 의미

Correl 함수를 쓰면 결과는 -1~1까지로 도출됩니다. 그 뜻은 무엇이냐?


=Correl(X, Y) 가
1 이면 X와 Y가 완전히 같다.
0 이면 X와 Y가 완전히 관계없다.
-1이면 X와 Y는 완전히 반대의 관계이다.


1, 0, -1로 결과가 떨어지는 것은 아니고 1에 가까울 수록 X와 Y가 관계가 높다는 것이고 -1에 가까울 수록 반대 관계를 갖는 다는 소리입니다.


그러면 위 사진 결과로 볼 때 X에 시청시간, Y에 시청시간을 넣었으므로 당연히 같은 데이터니깐 1이 나와야 하는 거겠죠? 그러면 이 표를 다 채우면 우리는 각 데이터들이 얼마만큼의 상관관계를 갖는지 알 수 있습니다. 조회수가 어떠한 수치와 관련이 있는지? 구독자는 어떠한 수치와 관계가 있는지 등의 결과를 말이죠.


우리는 조회수가 많이 나오게 하는 일련의 원인이 무엇인지 그 알고리즘이 궁금한 것이므로 이 표를 다 채우면 유튜브가 내 채널의 어떤 수치를 기반으로 조회수를 늘려주는지 알 수 있게 됩니다.


4. 계산 결과

그래서 결론을 내리기 위해 마저 아래 그림과 같이 셀을 채워봅시다. 



그러면 위 사진과 같은 결과를 얻을 수 있습니다. 오른쪽 아래 그림과 같이 대각선의 모든 데이터는 100%의 값을 갖게 되는데 당연히 같은 데이터를 X, Y로 참조하므로 Correl 값이 1 즉, 100%의 상관관계를 지닌다는 것을 알 수 있습니다. 그러면 위 데이터를 가지고 시청시간 부터 노출클릭률이 각각 무엇과 관련이 있을런지 알아보겠습니다.


방법은 시청시간부터 쭉 아래로 어떠한 수치들이 높은지 보고 조회수로 넘어가서 또 어떤 수치들이 높나 보고를 반복하면 됩니다. 우리는 조회수를 높이는 요소들을 찾아볼 것이므로 조회수를 기준으로 각 요소가 얼마나 관계가 있는지 알아봅시다.



결과 해석!! 여기서부터 다시 보시면 됩니다!!

위 결과 요약 : 유튜브 통계 각 요소들과 조회수와의 상관계수(Correlation)를 구하는 Correl 엑셀 함수를 이용하여 어떠한 수치가 조회수와 관계가 있나 알아보기


- 시청시간(시청자들이 영상을 본 총 시간)
해석을 해봅시다. 조회수가 높을 수록 시청시간이 높은 것은 너무나 당연한 거겠죠? 이 둘은 100%의 관계를 갖습니다. 


- 조회수(시청자들이 영상을 본 횟수)

사실상 시청시간과 동일하므로 생략


- 평균시청 지속 시간(1번 조회마다 영상을 본 평균 시간)

"평균시청지속시간이 높으면 조회수에 유리하다." 

우리가 당연한듯하게 생각할 수 있는 전제입니다. 그러나 그 영향이 절대적이지 않는 다는 걸 보여줍니다. 조회수와는 22%의 관계를 지닙니다. 


이 정도 수치면 관계가 있는 듯 하면서도 크게 없는 수치입니다. 대략적인 경향성은 맞지만 꼭 연관이 있지는 않은 애매한 수치지요. 그런데 일전에 포스팅한


[주인장 이야기/유튜브이야기] - #1 유튜브 한달째 정리 - 유튜브 노출 알고리즘 스터디 - 남보르TV

*아래 나올 이야기들을 이해하시는데 도움이 될 겁니다.


위 포스팅에서 정리한대로 이 결과는 5중 10대 알고리즘과 관련이 깊습니다. 10개 중 중박, 대박 합치면 2~3개의 영상이 조회수가 많이 나올 확률을 지니는데 이 비율과 일치한다는 것을 보면 시청지속시간이 오지게 잘나와도 결국은 5중 10대 알고리즘으로 어떤 영상이 잘될 지는 유튜브가 결정한다는 겁니다.


- 평균조회율(1번 조회하면 영상을 몇%시청하나)

사람들이 당연히 중요할 것이라고 생각하는 평균조회율. 당연히 재미있으면 사람들이 높은 비율로 영상을 다 볼 것이고 그러면 잘만들어진 영상이 아니냐 이런건 유튜브가 당연히 밀어주겠지라고 생각할 수 있는 수치입니다.


그런데 놀랍게도 그 어떤 수치와도 별 관계가 없습니다. -17%~15%까지 분포를 보이고 특히나 조회수와의 관계는 무려!!! 0%입니다.


아무리 5분짜리 영상이 100%의 조회율을 갖던 500분짜리 영상이 1% 조회율을 갖던 평균시청 지속시간은 둘다 5분이 되는데 이 두 영상은 유튜브가 어느쪽을 선택해서 더 선호하지는 않는 다는 겁니다. 두 영상 중 10초라도 더 높은 평균 시청 지속시간을 갖는게 조회수를 높이는 데 중요합니다. 


- 구독자(영상을 보고 구독하는 구독자 수)

구독자를 많이 모으려면 조회수를 늘리셔야 합니다. 조회수와 80%의 관계를 지닙니다. 특히 1% 구조비(구독자, 조회수 비율) 룰에 의해 대략적으로 조회수에 1%에 해당하는 구독자 수를 모을 수 있습니다. 

구독자수가 많아서 조회수가 많은 것이 아니라 조회수가 많아서 구독자수가 많은 겁니다. 


구독자수가 많으면 영상이 노출되는 숫자가 많아지고 이 때문에 조회수가 쉽게 늘어나는 것이니 이 관계를 똑바로 알아야합니다. 영상을 보고 구독을 하지 구독을 하고 영상을 보지는 않지 않습니까.


- 노출수(영상이 노출되는 횟수)

노출수가 조회수와의 상관계수가 100%라는 수치는 많은 것을 시사해줍니다.


유튜브의 노출은 전적으로 유튜브 알고리즘이 결정합니다. 추천동영상에 박히는 것도, 검색란의 순서도, 인기영상에 오르는 것도 모두 유튜브가 결정합니다. 그런데 이 노출이 시청시간과 연관성이 100%라는 것은 유튜브가 얼마나 노출시켜주느냐가 제 채널의 모든 것을 결정한다는 겁니다. 


어떠한 이유가 되었건 알고리즘의 방향이 조금이라도 바뀌면 잘되던 채널도 개박살이 날 수도 있고 안되던 채널도 초대박이 날 수도 있습니다. 전적으로 유튜브가 좋아하는 포인트를 잘 건드려야 하는 이유가 됩니다.


- 노출클릭률(노출되었을 때 들어오는 비율)

노출 클릭률이 높으면 조회수와 대략 40%의 관계를 지니고 있군요. 그런데 클릭률이 높을 뿐인데 시청시간도 44%로 높은 경향이 있다니? 이 것은 사람들이 궁금해하는 강도가 강할 수록 시청도 오래해주는 경향을 지닌 다는 것을 의미합니다. 자기가 궁금해서 들어오면 내용이 좋든 나쁘든 비교적 많은 시간을 할애한다는 것을 의미합니다. 


게다가 다른 전반적인 수치들 모두 40% 내외의 관계를 갖는 것이 노출클릭률입니다. 노출클릭률은 사람들이 영상을 궁금해하는 강도와 비례합니다. 따라서 사람들이 궁금해하는 영상을 제작해야만 하는 것이죠. 


그래서 정보가 좋든 나쁘든 간에 어그로 채널이 항상 잘되는 이유와 같습니다. 


데이터 해석 결과

결과를 정리해보면 조회수는 노출클릭률이 높아야 하는 경향이 분명합니다. 유튜브가 어그로 정치, 사회이슈를 절대적으로 좋아할 수 밖에 없다는 것을 의미합니다. 노출클릭률이란 곧 대중의 관심의 척도이고 이를 유튜브가 따라가게끔 만들어놓은 것이지요.


오늘의 결과를 보면 유튜브 한달째 분석에서 올려드린 세가지 알고리즘

1% 구조비

, 4분 50%

, 5중 10대의 해석 또한 달라진 다는 것을 알 수 있습니다. 


먼저, 첫번째 1% 구조비는 제가 지금 대략 5만 5천 조회수에 540명 구독자이니까 0.98%의 구조비로 거의 일치하는 경향을 보입니다. 


그런데 두번째 4분 50%는 폐기해야 할 것 같습니다. 특히 조회율 50%는 전혀 관련없는 데이터일 뿐이었고, 4분의 시청시간은 길면 좋지만 그렇다고 완전히 결정적인 것은 아니며 다음에 말씀드릴 5중 10대와 연계되어 해석해야할 수치였습니다.


세번째 5중 10대는 유효합니다. 분명히 유튜브는 모든 영상을 떡상시켜 주지 않습니다. 10개 중 2~3개의 영상만을 떡상시켜줍니다. 그 떡상의 기준은 채널마다 매우 다릅니다만 결론적으로는 노출클릭률이 높고 시청시간이 긴 경향이 있는 영상 중에 2~30%의 확률로 영상 노출을 많이 시켜줍니다.


총 정리를 해보면 노출클릭률 확보가 최우선이라는 겁니다. 노출클릭률은 영상의 시청지속시간을 올리는 경향이 있고, 이는 모든 수치와도 높은 경향성을 지닙니다. 유튜브계의 만능 버프라고 생각하시면 될 것 같습니다.


그런데 이것은 어그로를 지저분하게 끌라는 이야기는 아닙니다. 노출클릭률이 높다는 것은 그만큼 충성시청자 층이 많다는 의미로도 해석이 되고 그만큼 정보를 알려는 사람들이 많다는 의미이기도 하기 때문에 여기서의 어그로란 의미는 사람들이 관심을 가질만한 주제를 하던가 내가 관심의 대상이 될만한 유튜버가 되던가를 의미합니다.


이래도 안되고 저래도 안되는게 유튜브가 아니었습니다. 문제는 단지 우리가 대중의 관심을 못받는 게 문제였을 뿐이었습니다. 제가 전문분야로 유튜브를 하며 개론 수준의 영상일 때는 그래도 조회수가 나오는 편이었지만 점점 더 깊은 내용으로 갈 수록 조회수가 산으로 가게된 이유와 같습니다.


결론은 여타 유튜브 꿀팁영상들과 다를바가 없이 어그로를 끌어라!로 끝나버렸지만 오늘의 의의는 실제로 어그로와 관심이 조회수에 얼마나 영향을 주는지 확인을 했다는 것에 의의가 있을 것 같습니다.


여러분들의 채널도 이 결과와 비교해보시고 완전히 다른 결과가 도출되시거나 하면 코멘트 달아주시면 한번 같이 분석해보는 시간을 가질까합니다.


이 포스팅 관련 남보르TV 영상!!!




댓글

💲 추천 글