본문 바로가기
IT 이야기

유튜브의 추천 알고리즘/데이터 기반 개인화 서비스

by 브라보Bravo 2021. 5. 30.
728x90
반응형

최근 겪은 신기한(?) 그러나 새롭진 않은, 유튜브 추천영상 

 

회사 동료와 일 이야기를 하다가 사담으로 넘어가면서 지인이 최근 이사간 집 이야기가 나왔다.

경기도 소재에 위한 타운 하우스 주택은 모두의 로망인 '마당 있는 집'

어떻게 이사를 결심하게 됐냐, 마당은 어떠냐, 주택 정말 좋냐 이런 저런 이야기를 하다가

지인은 '서울엔 우리집이 없다' 라는 프로그램이 아주 재미나다며 주말에 땅이나 집 구경을 그동안 하고 다녔다고 한다. 

 

평소 TV 정규 방송을 보진 않아서 처음 듣는 프로그램이라 구글에서 '우리집이 없다'를 검색하고 아 이런 프로그램이구나 한 두페이지를 참고하고 창을 닫았는데 이후, 2-3시간 쯤 유튜브를 켰는데 추천 영상으로 주택 관련 영상들이 뜨기 시작했다.   아 맞아, 구글과 유튜브는 한 가족이지..

 

 

우리가 흔히 이야기하는 

'유튜브의 알수 없는 알고리즘이 나를 인도하였다' 라고 우스개 소리로 이야기하지만,

사실 유튜브 알고리즘은 사용자를 유튜브에서 빠져나갈 수 없도록 고도화되어있는 것이다. 

 

유튜브 알고리즘이란?

각 동영상의 제목, 미리보기 이미지, 설명을 이용하여 관심분야를 파악. 동영상을 얼마나 시청했는데 좋아요와 싫어요가 있는지 댓글 작성자의 수를 파악하고, 각 시청자의 동영상 선호도를 분석한다 

 

유튜브 추천영상 알고리즘은?

과거 먼저 본 영상의 관련 영상을 보여주면서 관심이 있을만한 영상도 같이 추천하여 사용자가 더 많은 영상을 보도록 유도한다.

 

최근 나도 유튜브가 검색엔진으로도 쓰이고, 보는 영상 수도 더 많아졌다. 

TV, 넷플렉스보다 유튜브가 더 재미있는듯  중독된듯

 

구글에서 수집하는 개인정보

  • 검색하는 단어
  • 시청하는 동영상
  • 콘텐츠와 광고 조회 및 상호작용
  • 오디오 기능 사용시 음성 및 오디오 정보   (응?)
  • 구매 활동
  • 사용자가 교류하거나 콘텐츠를 공유하는 사람들
  • 구글 서비스를 사용하는 타사 사이트와 앱 활동
  • 사용자가 구글 계정과 동기화된 크롬 브라우징 기록 
  • 구글 서비스를 활용하여 통화하거나 메시지를 주고 받을 경우 통화 및 메시지 로그 정보
  • GPS, IP 정보 기기 센서 정보, 주변 Wifi 액세스 포인트 정보등

 

자세한 정보는 다음 사이트에서 참고가능하다

 

개인정보처리방침 – 개인정보 보호 및 약관 – Google

방침 정보 이 방침의 적용 이 개인정보처리방침은 YouTube, Android, 타사 사이트에서 제공되는 서비스(예: 광고 서비스)를 포함해 Google LLC 및 계열사가 제공하는 모든 서비스에 적용됩니다. 이 개인

policies.google.com

내 정보는 이미 퍼지고 퍼져있다

 

개인정보는 '살아있는 개인'을 특정할 수 있는 정보를 뜻한다. 따라서 그 자체만으로 자신을 인식할 수 있는 개인정보 외에도, 여러 정보를 연결함으로서 특정지울 수 있는 개인정보들의 집합 자체에 대한 관리가 기업에게 중요하다. 

 

개인정보가 노출되면 기업의 보안 사고이므로 벌금도 문제지만, 기업의 최고 정보 보안 책임자가 감옥간다.  기업 평판에도 큰 위험을 가한다. 따라서 개인정보 유출이 되지 않도록 기업에서는 엄청 노력을 하고 있다. 

 

그렇지만 자기들이 보관하고 있는 개인정보는 어떻게든 회사에 유리한 방향으로 써먹어보겠다는게 기업의 생태인것이다. 위험을 감수하고서도 개인정보를 왜 취득하겠는가, 다 돈이 되니 취득하는것이다.

 

 

정보 기반 개인화

각 기업보다 수집한 고객 데이터를 바탕으로 알고리즘으로 정제/분석하고, 각 개별 고객의 니즈에 부합된 개인화된 정보를  제공함으로서 고객의 만족도를 높이고 더불어 기업의 이익을 높일 수 있는 기회를 지속적으로 발굴하려 한다.  고객에게 유의미한 자료를 제공할 수 있는 알고리즘을 가진 회사야 말로 요즘 파워를 가진 회사라 볼 수 있다. 

 

알고리즘이란 ? 페르시아 수학자인 알콰리즈미의 이름에서 유래하고 '문제 해결을 하기 위해 정해진 일련의 절차와 방법을 공식화한 형태'를 의미한다.

 

'취향저격' 제품은 갑자기 하늘에서 떨어지지 않는다. 당신이 흘린 데이터를 이용하여, 당신의 나이대가 관심있어할만한, 또는 당신과 유형이 비슷하게 형성된 사람들의 데이터를 활용하여 욕구를 자극하는 추천 제품들을 쏟아낸다. 

과거 생산자 중심에서 현재 소비자 중심으로 시장의 패러다임이 변화가 되었다. 이제 자기 취향 제품이 아니면 소비자들은 지갑을 잘 열지 않는다. 따라서, 그런 고객의 취향과 선호를 모아놓은 데이터는 기업의 큰 자산이 된다. 

 

 

개인화 데이터의 위험 - 에코 챔버 효과 

 

 

 

반향실 효과 - 위키백과, 우리 모두의 백과사전

위키백과, 우리 모두의 백과사전. 반향실 효과는 극단적일 경우 단 한 명이 만든 정보가 커뮤니티 안에서 지속적으로 반복될 수도 있다. 반향실 효과(反響室 效果, 영어: echo chamber)는 뉴스 미디

ko.wikipedia.org

 

위키에서는 '뉴스 미디어가 전하는 정보를 이용하는 이용자가 갖고 있는 기존의 신념이 닫힌 체계로 구성된 커뮤니케이션에 의해 증폭, 강화되고 같은 입장을 지닌 정보만 지속적으로 되풀이 수용하는 현상' 이라고 한다. 

 

(갑자기 타진요가 떠오는군..)

 

 

개인화 서비스로 자신이 선호하는 정보를 손쉽게 추천받아 볼 수 있는 반면에, 

예전보다 더 중독되고 편향된 내용에 쉽게 노출될 수 있음을 인식해야한다. 

 

기업 입장에서는 더욱 더 고객을 그렇게 만들어서 평소 좋아하는 제품을 더욱 좋아하게 만들어 소비하게 만들어야 되지만, 개인의 입장에서는 제품을 살 때 정말 필요한 제품이 맞는지 아닌지 생각해볼 문제다. 

 

 

 

 


 

유튜브 알고리즘 초기화 

유튜브 시청 관련 데이터를 지우고 다시 처음부터 유투브가 영상을 추천해주길 원한다면, 초기화하는 방법도도 존재. 그러나 나라면 차라리 관심 없는 영상이 뜨면 '관심없음'으로 로깅 하겠음. 

 

유튜브 알고리즘 초기화로 새로운 맞춤동영상을 받아보자

이 글에서는 유튜브 시청 기록 초기화 방법과 시청 기록을 유튜브에 남기지 않는 방법을 살펴보겠습니다. 익히 알려진 대로 유튜브는 사용자의 데이터 기반으로 새로운 동영상을 추천해줍니

dotworks.tistory.com

 

이만

728x90
반응형

댓글