["일단은 수집 자체에 대해서 문제를 삼을 수는 없겠지만 그게 애초에 합리적으로 예상할 수 있는 목적 범위 바깥으로 쓰인다고 하면 이제 그에 대해서는 문제 제기를 할 수가 있을 것이고요."]
[자막] Q. ChatGPT를 이용할 때 어떤 경로로 개인정보가 유출될까요?
["개념적으로는 인공지능 모형이 개발되는 과정을 한 축으로 볼 수 있고 그 다음에 모형이 개발된 이후에 실제 적용되는 과정 이렇게 둘로 나눠서 볼 수 있을 것 같아요."]
[자막] 개인정보 유출 경로 ①모형 개발 과정 ②이용과정
[자막] Q. 모형 개발 과정에서 개인정보가 유출될 경우?
["모형이 개발되는 과정이라고 하면 모형이 개발되는 과정에서 데이터를 여기저기 여러 경로로부터 수집을 하게 되고요."]
["그 수집하는게 첫 단계고 수집한 다음에 수집된 데이터를 그대로 인공지능 학습용으로 쓰지 않고 그 학습용 데이터셋을 별도로 구축을 합니다."]
[자막] 개인정보가 식별되지 않도록 가명·익명처리 등 비식별 처리
["그 과정에서 보통은 비식별 처리를 하게 되고요."]
[자막] 학습 데이터를 기반으로 ChatGPT 구축
["인공지능 학습 데이터 구축한 것으로부터 알고리즘을 통해서 이제 인공지능 모형이 이제 구축이 되는 것인데 개념적으로는 그런 식으로 몇 단계를 거쳐서 인공지능 모형이 개발되는데."]
[자막] 개발 단계를 거치면서 섞일 수 있는 개인정보
["각각의 단계에서 개인정보가 섞일 가능성이 있게 되기 때문에 개인정보가 익명 처리가 되든지, 우리 법상 개념으로는 가명 처리해서 과학적 연구 목적으로 쓸 수 있는.. 뭐 이런 경로가 있는데, 그런 식의 법적인 경로를 고려해 가면서, 인공지능 모형이 이제 개발되도록 해야 될 것인데.."]
[자막] 고학수 위원장의 지적 개발 과정에서 개인정보 보호 소홀
["각각의 단계에서 자칫하면 개인정보가 섞여 들어가면서 경우에 따라서 유출이 될 수 있는 그런 가능성은 열려 있어요."]
[자막] Q. 이용 과정에서 개인정보가 유출될 경우?
["다른 한편 일단 인공지능 모형이 개발된 다음에 대부분의 경우는 이용자랑 이제 인터랙션을 합니다."]
["챗봇 같으면 채팅과 같은 형태가 될 것인데 그럼 질문을 하고 답을 주는 형태인데, 답이 나오는 과정에서 또 그 개인정보가 유출될 가능성 또는 만약에 학습 데이터에 개인정보가 섞여 들어가 있었으면"]
[자막] 학습 데이터의 개인정보가 사용자에게 그대로 노출
["학습 데이터에 있었던 내용이 그대로 노출되는 경우가 논문에서는 이제 그런 사례들이 나온 경우도 있습니다."]
[자막] 활용 과정에서 개인정보 유출 가능
["실제 활용 모형이 개발된 후에 활용되는 과정에서도 개인정보가 유출될 가능성은 열려 있기 때문에 큰 틀에서는 모형이 개발되기 전, 모형의 개발된 후에 활용되는 과정 이렇게 나누어서 생각해 볼 수 있겠습니다."]
[자막] Q. ChatGPT의 개인정보 수집을 사전에 차단할 수 있는지?
["그것도 앞으로 점점 더 큰 과제로 대두가 될 것 같은데요."]
[자막] 인터넷 공간의 특수한 개방성
["일반적으로는 인터넷이라고 하는 것이 개방성을 특징으로 하는 것이고, 말하자면 정보의 바다에서 어디에 어떤 정보가 있는지를 우리가 쉽게 찾을 수 있고, 알 수 있게"]
[자막] 정보 접근이 쉽다는 인터넷의 장점
["내가 원하는 정보를 내가 원할 때 찾아낼 수 있게 하는 이게 이게 인터넷의 특징이었는데 그런 인터넷의 작동이 원활하게 되기 위해서는 여기저기 흩어져 있는 정보들을 우리가 정리를 하고 인덱싱을 한다고 하죠."]
[자막] 인덱싱(Indexing) : 색인 작성 정보 검색을 용이하게 하기 위해 기록에 대한 접근점이 될 용어를 정하고 적용하는 과정
["인덱싱을 쉽게 할 수 있게 하고 표준화가 잘 이루어지고, 말하자면 각각의 울타리를 치지 않는 것이 대체적으로 이제 전제가 되는 것이었고요."]
["이제 개인정보 맥락에서 생각을 해보면 제일 쉽게 생각해 볼 수 있는 예는 이런 겁니다."]
["대학교에 가면 학과 소개가 있고, 학과 소개 중에 뭐 중요한 부분은 학과 교수님들에 관한 설명입니다."]
["이제 어떤 교수님들이 있고 그 교수님들 이력이나 학문적인 관심 또는 전공 분야 이런 것들을 설명 또는 로펌에 가면 로펌 구성원의 핵심은 변호사들이기 때문에 변호사분들에 관한 소개 자료들이 이제 홈페이지에 다들 있죠."]
["그렇게 학교 교수님들에 관해서 또는 로펌 변호사들에 관해서 정보를 쭉 추출해서 데이터베이스를 구축하고, 그와 관련된 인공지능 모형을 개발하는 것도 생각을 해 볼 수가 있는데, 그렇게 정보를 가져오는 것 그걸 이제 크롤링이라고 보통 표현을 하고"]
[자막] 크롤링(crawling) 웹사이트, 하이퍼링크, 데이터, 정보 자원을 자동화된 방법으로 수집, 분류, 저장하는 것
[자막] 스크래핑(scraping) 웹컴퓨터 프로그램이 웹 페이지나 프로그램 화면에서 데이터를 자동으로 추출하는 것
["또는 스크레이팅 한다고도 하고 그러는데 만약에 그렇게 정보를 가져가는게 싫다라고 하면 크롤링이 되지 않도록 기술적인 방식으로 말하자면 울타리를 치는 것도 가능하죠."]
["그러면 울타리가 많이 쳐지면 처질수록, 이제 인터넷이 이렇게 좀 쪼개지고 파편화 되는 경향으로 갈 수가 있을 것이고, 당연히 우리가 익숙한 인터넷 환경으로부터 쪼개진 인터넷으로 갈 가능성이 있는데 큰 틀의 질문이 이렇게 되는 거죠."]
[자막] 지나치게 무분별한 정보 수집
["정보를 너무나 무분별하게 수집하게 되면 문제 아닌가?"]
[자막] 정보 수집 중 섞여 들어간 개인정보
["그러다가 개인정보가 섞여 들어가게 되면 또 다른 차원의 문제가 있는 것 아닌가?"]
[자막] 사전 관리와 통제의 필요성
["그에 관해서 좀 통제가 필요한 것 아닌가?라고 하는 일정 부분 정당한 문제의 의식이 있고, 다른 한편 그런 통제가 또 심하게 가면 우리가 익숙한 인터넷이 점점 쪼개진 방향으로 가면"]
[자막] 자유로운 인터넷 이용의 제한 혹은 불편 발생
["정보의 흐름에 부당한 또는 불편을 가져오는 방향으로 갈 수가 있기 때문에"]
[자막] 개인정보 지키미 학수 "새로운 인공지능 세상에는 시대에 맞는 고민이 필요하다"
["그 사이에서 어떻게 균형을 잡아야 할 것이냐 새로운 인공지능 세상에서 추가적인 고민이 필요한 영역이 될 것 같습니다."]
[자막] Q. ChatGPT가 불러온 개인정보 유출 문제, 대안은 있을까?
["합리적으로 예견 가능한 선에서는 정보를 수집해서 쓰는게 허용이 될 것 같고요."]
["다만 그게 허용된 범위가 상식적으로 또는 합리적으로, 예견된 범위나 목적을 벗어나면 곤란할 것이고,다른 한편 애초에 그렇게 학교 홈페이지에 올리거나 한 유형의 정보가 아닌, 일반 공개가 된 정보가 아닌 종류의 정보가 어찌어찌해서 수집이 되거나 하면, 그런 경우에는 애초에 수집 자체에 대해서도 문제 제기를 할 수 있을 것 같습니다."]
["이제 아마 조금 더 현실적인 질문은 합리적으로 예견 가능한 범위를 어떤 식으로 판단할 것이냐, 그거보다 더 개개인 입장에서 그렇게 문제 상황이라고 판단이 될 때, 어떤 경위, 어떤 경로, 어떤 절차를 거쳐서 '저는 이거 문제인 거 같은데요?' 라고 말을 할 수가 있고 합당한 뭐랄까 그 문제 제기를 통해서 '동의를 철회한다' 라든가 또는 '구제를 받는다' 라든가 하는 거를 마련할 것이냐 하는게 굉장히 큰 과제로 앞으로 나타날 것 같고요."]
["더 큰 과제는 이번에 ChatGPT 이런 새로운 기술을 통해서 볼 수 있는 같이, 전 세계가 동시에 기술 개발을 하고, 개발된 기술이 전 세계 동시에 서비스가 되는 이런 상황으로 점점 가고 있습니다."]
[자막] 세계가 함께 움직이는 글로벌 시대
["그러면 한국에 있는 이용자, 소비자가 미국이 됐건 유럽이 됐건 다른 어떤 나라에 있는 기술 또 해당 국가에 있는 회사가 제공하는 서비스를 이용을 하다가 '어? 이건 문제 같은데?'라고 할 때, 어떤 식으로 문제제기를 할 수 있을지, 어떤 경로를 문제 제기할 수 있을 것인지 하는게 동시적으로 전 세계에서 나타나고 있는 이런 상황이라서"]
[자막] 소비자 선에서 해결방법 필요
["이제 소비자 입장에서도 이걸 어떻게, 어디 가서 하소연을 할 것인가 또는 규제 감독기관 입장에서도 나라에 따라 사실은 법이 약간씩은 이제 다른데, 모든 개발 회사들 보고 전 세계의 모든 법을 동시에 맞춰가면서 개발을 하라고 요구하는 것도 사실은 현실적이지 않은 면도 있고 해서"]
[자막] 현실적으로 어려움
["어떻게 서로 여러 나라 사이의 규제 감독 기관들이 소통을 하라고 각각의 나라에 있는 규제 감독 기관들은 그런 상황에 대해서"]
[자막] 전 세계 감독 기관이 함께 소통해야 하는 문제
["어떻게 원활하게 문제 해결을 할 수 있도록 할 것인지, 그런 맥락의 고민이 이제 대두가 되고 있고요."]
["뭐 그런 점에서 지금 저희 위원회에서도 굉장히 많은 고민을 하고 있고, 일단 여러 나라의 규제 감독기관들하고 소통하고 있는 그런 작업들은 하고 있는 중입니다."]
["다음 얘기가 궁금하신 분들은 구독, 좋아요, 알람 설정 꼭 부탁드립니다. 감사합니다."]
[자막] 더 흥미로운 이야기로 다시 만나요