A. 주제

AI 작품, 어디까지 저작권을 인정받을 수 있을까?, 장종원, 2024.08.13, SAMSUNG SDS

AI 작품, 어디까지 저작권을 인정받을 수 있을까? | 인사이트리포트 | 삼성SDS (samsungsds.com)

 

AI 작품, 어디까지 저작권을 인정받을 수 있을까? | 인사이트리포트 | 삼성SDS

AI가 만든 콘텐츠에 대해 한 가지 해결하기 어려운 논란이 존재합니다. 바로 ‘저작권’입니다. AI가 만든 콘텐츠에는 어떻게 저작권을 적용해야 할까요?

www.samsungsds.com

 

B. 요약

AI로 생성된 콘텐츠의 저작권 문제는 매우 복잡하고 논의가 필요하다. 각국의 법과 규제는 AI가 생성한 작품에 대한 저작권을 다르게 적용하고 있다. 일부 국가는 AI가 만든 콘텐츠에 대해 저작권을 인정하지 않으며, 이는 창작자의 권리를 침해할 수 있다. 이러한 불확실성은 법적 분쟁과 갈등을 초래할 가능성이 높다. 또한, AI 기술의 발전으로 인해 콘텐츠 생성이 용이해지면서 저작권 문제가 더욱 중요해졌다. 따라서 AI 콘텐츠의 저작권에 대한 명확한 규정과 정책이 시급히 필요하다. 이를 통해 창작자와 AI 시스템 간의 권리와 책임을 명확히 하고, 공정한 환경을 조성할 수 있을 것이다. 
 

C. 핵심 포인트

AI 저작권 문제를 어떻게 해결해야할지, 관련 법규가 있는지, 해외에서는 어떻게 다루고 있는지에 대해 정리하였다.

 

1. 대한민국
- 저작권 인정 사례: AI가 제작한 영화 'AI수로부인'에서 저작권이 부분적으로 인정되었다. 그러나 이는 '편집저작물'로서, AI가 만든 이미지나 영상 자체에 대한 저작권이 아니라, 인간이 배열한 부분에 대해서만 인정되었다.
- 저작권 가이드라인: 한국저작권위원회에 따르면 저작물은 '인간의 사상 또는 감정을 표현한 창작물'로 정의되며, AI가 만든 산출물에 대한 저작권은 인정되지 않는다. 인간의 추가 작업이 있어야 저작물성이 인정되며, 창작성이 포함된 요소의 배열만 저작권 등록이 가능하다.

 

2. 미국
- 저작권 인정 사례: 그래픽노블 '새벽의 자리아'에서 미드저니를 사용한 부분에 대해 제한적으로 저작권이 인정되었다. AI로 만든 이미지나 텍스트의 선택 및 배열에 대해서만 저작권을 인정하고, 작품 자체에 대해서는 저작권이 인정되지 않는다.
- 전반적인 경향: 대부분의 AI 작품에 대해 저작권을 인정하지 않는 것이 일반적이며, 제한적인 인정 사례가 나타나고 있다.

 

3. 중국
- 저작권 인정 사례: 베이징 인터넷 법원에서 AI가 만든 이미지에 대해 저작권을 인정하였다. 이는 AI툴을 활용하여 생성된 이미지가 독창성을 가진 창작물로 판단되었다는 의미이다. 

<추가설명: 중국의 블로거가 콘텐츠 공유 플랫폼에서 무단으로 사진을 가져온 후 AI툴을 활용해 여성 이미지 제작하였으나, 사진 속 여성이 이를 발견하고 중국 블로거를 고소함.>

- 판결 내용: 피고(블로거)에게 소유권을 인정하되, 무단 사용에 대한 손해배상금 지급을 명령하였다. 인간의 개입(프롬프트 작성, 매개변수 설정 등)이 독창성에 기여했다고 판단하였기 때문이다.

 

4. 마무리
대체로 AI 작품에 대한 저작권을 제한적으로 인정하며, 대부분의 국가들은 저작권을 인정하지 않았다. 그러나 중국의 

AI 작품에 대해 저작권 인정 사례가 있어 향후 국제적인 저작권 기준에 영향을 미칠 가능성이 존재한다. AI 저작권 문제는 지속적으로 논의되고 있으며, 각국의 법적 기준과 판례에 따라 다르게 나타날 수 있다.

 

D. AI 작품

1. 나라지식정보에서 제작한 AI 수로 부인

https://www.youtube.com/watch?v=K61g6Rtyx90

 

 

2. 미국 그래픽노블의 '새벽의 자리아' (코믹북)

새벽의 자리야 이미지 (출처: AI코믹북스 - ‘https://aicomicbooks.com/book/zarya-of-the-dawn-by-kristina-kashtanova-download-now/’)

E. 용어정리

- 저작권: 저작권법 제2조 1항 "저작물"은 인간의 사상 또는 감정을 표현한 창작물을 말한다.

- 저작자: 저작권법 제2조 2항 "저작자"는 저작물을 창작한 자를 말한다.

F. 마무리

해당 아티클에서 다룬 것과 같이 AI 생성 콘텐츠의 저작권 문제에 대한 논의가 있으나, AI 저작권의 정의 모호성, 인간 기여도의 기준 부족, 국제적 차이 반영 부족, AI 독창성에 대한 논의 부족, 법적 구속력의 한계 등의 문제점이 존재한다. 

AI 기술이 빠르게 발전하는만큼 그에 대한 법적 및 사회적 논의도 함께 발전해야한다. 명확한 기준과 규제는 더 나은 창작 환경을 만들 수 있을 것이라 생각한다.

 

A. 주제

지속 가능한 AI 비즈니스를 위한 ESG 프레임워크, 김영욱, 2024.02.28

지속 가능한 AI 비즈니스를 위한 ESG 프레임워크 | 인사이트리포트 | 삼성SDS (samsungsds.com)

 

B. 요약

생성형 AI는 기업의 비즈니스 전략에서 필수적인 요소로 자리잡고 있다. 이를 통해 데이터 분석과 예측 능력을 강화하여 시장 변화에 신속히 대응할 수 있다. ESG 프레임워크는 기업이 지속 가능한 발전을 도모하고 리스크 관리 체계를 강화하는 데 중요한 역할을 한다. 두 요소의 융합은 기업의 혁신적이고 책임있는 경영을 실현하는데 기여한다.

 

C. 핵심 내용

생성형 AI는 기업 비즈니스 전략에서 필수적인 요소로 자리잡고 있으나 동시에 리스크를 동반하기도 한다. 저작권, 규제 및 데이터 관리와 관련된 다양한 리스크로 확대될 수 있으며 기업의 평판 및 가치 하락으로 이어질 가능성이 있다. 따라서 ESG 프레임워크의 도입이 강조되고 있다.

 

1. E (Environment, 환경적 요소) 

알고리즘이 제대로 동작할 때까지 엄청난 양의 데이터를 학습하며, 에너지를 소모하기에 큰 탄소 발자국을 남긴다.ESG 는 환경의 지속 가능성을 강조하므로 AI 산업이 이 원칙을 따를 수 있을지 고민해야하며, 탄소배출을 줄이고자 하는 노력이 필요하다.

 

2. S(Social, 사회적 요소)

사회적 평등과 다양성은 ESG관점에서 중요한 가치이다. 그러나 AI는 훈련 데이터에서 나온 편견 및 편향을 결과에 제한 없이 반영할 수 있다. 개인 정보 보호 및 데이터 보안을 강조하는 면에서 AI를 살펴보면 데이터 처리 및 저장에 있어 개인 정보 노출과 관련된 문제가 있다. 

 

3.G(Governance, 거버넌스적 요소)

법적 규제 및 준수와 의사결정 과정의 투명성에 대한 리스크가 발생할 수도 있다. 투명한 의사결정은 ESG원칙 준수에 따른 신뢰를 증진시키는 요소로, 거버넌스 영역에서 매우 중요한 요소이다. 투명성을 감소시키면 이와 관련된 의사결정이나 관리,감독이 어려워 진다. 

 

4. ESG 리포트

기업의 역할, 책임, 운영 방식을 체계화하여 AI 기술이 ESG 목표에 부합하도록 관리해야 한다. AI 거버넌스를 구축하고 운영하며, 이해관계자와 협력하는 정책과 절차 설정은 필수적이다. AI의 개발 라이프 사이클에 맞춘 End-to-end 거버넌스를 통해 각 단계별 책임과 평가 기준을 정립하여, 지속적인 모니터링과 성과 개선이 이루어져야 한다.

 

AI 기술은 ESG 관련 문제 해결의 잠재력을 가지고 있다. 에너지 사용을 최적화하거나 의료 접근성을 높이는 등 다양한 분야에서 긍정적인 변화를 이끌어낼 수 있다. 그러므로 기업은 AI기술의 리스크를 통제하고 ESG 원칙을 준수함으로써 지속 가능한 비즈니스를 발전시켜 나가야 한다.

 

D. 용어정리

1. ESG: Environment, Social, Governance의 약자로, 이해관계자가 기업의 3가지 비재무적 요소를 평가하기 위한 도구로 등장하였다. 최근에는 기업 관점에서 지속가능성을 달성하기 위한 핵심 요소를 의미하는 단어로 활용되고 있다.

- 지속가능성: 현재의 필요를 충족시키는 동시에, 미래 세대의 필요도 충족시키기 위한 발전 모델을 의미한다. 지속가능성은 자연환경, 사회, 경제 측면에서 발전이 지속 가능한 상태를 유지하는 것을 목표로 한다.

▷  중요도 : 기업목적, 자본조달, 지속가능

- 기업 목적: 미래 기업 가치를 제고하기 위해 추구해야할 사회적 가치로 보고 있으며 기업의 존립 목적에 내재화되어야 하는 필수적 요소로 자리 잡았다.

- 자본조달: 투자의사결정 과정에 영향력을 미치는 핵심요소로 부각되고 있으므로 자본조달 측면에서 필수적으로 관리되어야 하는 요소이다.

- 지속가능: 지속가능한 발전에 관한 국제사회 합의를 지지하는 개념으로서, 현재와 미래세대를 위해 추구해야하는 요소이다.

출처: ESG 공급망 지원센터 ESG란? 중

 

2. ESG 프레임워크

기업이 비즈니스의 환경, 사회 및 거버넌스 측면과 관련된 비즈니스 운영 및 기회와 위험을 다루는 데이터를 공개하는데 사용된다. 즉 기업이 비재무 정보를 투명하고 신뢰성 있게 공시하고, 지속가능성을 증진하는데 필요한 지침을 말한다.

참고: https://www.net-zero.kr/news/articleView.html?idxno=1171

 

한눈에 보는 글로벌 ESG 공시 표준과 프레임워크 - 탄소중립투데이

환경, 사회, 거버넌스(ESG) 문제는 기업의 핵심 의제로 부상하고 있습니다. 기업이 지속가능성 목표를 달성하고 책임 있는 경영을 실천하기 위해서는 다양한 글로벌 ESG 공시 표준과 프레임워크를

www.net-zero.kr

 

E. 사례

1. 네이버

▶ 더 나은 가치를 위한 네이버의 ESG 추진 전략

- 다양한 이해관계자와 올바른 관계를 형성하고 더 큰 가치를 제공하기 위해 빠르게 변화하는 사업 환경 및 ESG 규제 강화동향을 반영해 지속가능 경영 7대 전략을 수립하고 실천한다.

- 더보기: https://www.navercorp.com/esg/sustainability

 

지속가능경영 Sustainability Management

ESG 경영으로 완성하는 지속가능한 미래 Sustainability Management Strategies

www.navercorp.com

- 지속가능경영 7대 전략

네이버의 지속가능경영 7대 전략

 

A. 책 이름

빅데이터 시대, 성과를 이끌어 내는 데이터 문해력, 카시와기 요시키 지음, 프리렉

 

B. 주요 내용

처음 만난 상대에게 광범위하고 객관적인 주장을 합리적으로 전달할 수 있는 효과적인 도구가 바로 데이터이다. 절대적인 정답이 존재하지 않을 때, 당신은 어떻게 자신이 생각하는 바를 상대에게 전달하고 이해시킬 수 있을까요? 데이터에서 찾아낸 인사이트를 자신의 결론을 이끄는 이야기로 만드는 능력이 바로 데이터 문해력이다. 목적과 문제를 올바른 데이터와 연결해서 가치있는 결론을 낼 수 있도록 하는 사고방식과 기술을 안내한다.

 

위 글은 책 뒤에 적혀있는 내용으로 이보다 더 이 책을 잘 설명할 수 없다 생각하여 그대로 인용한다.

 

 C. 느낀 점

'올바른 목적을 설정하고 그 목적에 따라 데이터를 활용해서, 적절히 제시한 결과를 결론으로 이끌어간다'는 본질적인 흐름을 중시하고, 과정 하나하나 신중히 밟아가야 한다. 그것이 바로 가치 있는 성과를 창출하기위한 필수 조건

 

저자가 글을 끝마치며 잘막하게 작성했던 내용이다. 그 앞에 데이터를 잘 이해하고 해석하는지에 대해 수 많은 이야기들을 다뤘는데 이 두 문장이 작가가 하고 싶은 말을 가장 잘 표현하였다고 생각한다. 

 

'데이터 분석' , 'Data Analyst' 단어 그 자체로도 멋있다. 주어진 것들을 살펴보고, 추론하고, 이리 저리 맞춰보는 것들이 마치 프로파일링과 비슷해 보였다. 학부 연구실에서 공부하면서 데이터 수집에서부터 전처리, 시각화 그리고 그 결과를 통해 얻은 결론이 내었다. 그 결론은 책임자의 최종 결정의 근거가 된다는 사실이 설레었다. 그래서 데이터분석가가 되고 싶었다. 있는 그대로의 데이터를 읽는 것은 결과를 내는 것이지 결론을 도출하는 것이 아니다. 나는 유능한 분석가가 되고 싶다. 그런데 표와 그래프를 보고 해석하고 결론을 내는 방법을 모르겠어서 해당 책을 읽게 되었다.

 

1. 정의를 정의하다

가장 초반에 작가가 중요하게 이야기하는 부분 중 하나이다. 정의를 명확하게 하는 것. 그리고 문제 원인이 무엇인지 정확하게 파악하는 것. 해결해야하는 것이 명확해야하는 것. 즉 이 사건을 명확히하는 것에서 부터 시작해야한다는 것이다.

이 이야기를 하면서 대학 발표시간이 생각났다. 전공 과목 프레젠테이션를 시작하자마자 교수님께서 말씀하셨다.

정의부터 잘못되어 있어.
자율주행차량의 뜻이 level 몇 단계를 이야기하는것인지
너네가 진행한 실험은 어떤 것이지
프레젠테이션의 제목이라면 너네가 무슨 말을 할 것이라고 정확하게 말해줘야지.
두루뭉술하게 하나도 제대로 말하고 있는 것이 없잖아.
결국 사람들은 너희의 주장을 하나도 납득하지 못해.

 

그 때 내가 한 말은 단 한마디였다. "안녕하세요 journal201 입니다." 그리고 그 말이 나의 마지막 말이었다. 그 뒤로 모든 것에 대해서 육하원칙 방식으로 한 번 생각하고, '왜?', '이게 뭔데' 라는 두 마디를 입에 달고 살았다. 모든 것에 정의를 내리고, 무엇인지 제대로 파악하여 어떤 방식으로 어떤 이유로 사용하는지에 대해 고민한 결과들을 내었다. 그 시간들이 결코 쉬웠던 것은 아니었다. 왜 이 정도까지 해야할까 하는 생각도 많이 들었다. 하지만 이 책을 읽고 나니 내가 잘 한 것이구나 하는 안도감이 들었다. 같은 수업을 들었던 친구들 말에 많이 흔들렸었다. 이 정도로 하지 않아도 되는 일에 너무 많은 에너지를 쏟는 것은 아닐까 하는 생각이 문득문득 들었기 때문이다. 그러나 이 습관이 데이터 분석에 있어 매우 도움이 된다니 믿기지 않았고, 괜찮은 길을 걷고 있었던 것 같아 뿌듯했다.

 

2. 논리적인 과정을 따라가자.

본질을 흐리지 않고, 왜 이 과정을 따르는지에 대한 인식을 따라가며 지속적으로 의심하고 의심하는 과정을 가져야 한다. 원인부터 제대로 봐야한다는 점은 나도 신기했다. 어떤 현상에 대해 문제 해결방법을 도출하라 한다면 여전히 두리뭉실한 방법이 가장 먼저 떠오른다. 예를 들면 '매출이 줄어드는 문제가 발생했다. 이를 해결하라'라는 상황이 있다면 '가격 할인을 통한 고객의 소비 유도!' 혹은 '유명 모델과 함께 프로모션 상품 개발!' 이런 방식이 먼저 떠올랐을 것이다. 그러나 이제는 어떤 방식으로 상황을 바라보고 그에 대한 정의를 내리는 순간부터 명확한 원인분석을 통한 결과를 도출할 때까지 객관적이고 논리적인 과정을 따라가야 제대로된 문제점을 해소하고자 노력한다. 

 

D. 마무리

나 자신을 설득할 수 없다면 타인 또한 설득할 수 없다. 타인을 설득할 수 있는 가장 좋은 방법은 눈에 보이는 데이터를 통해 인과관계, 상관관계를 명확히 하고 이에 대한 원인 분석, 그에 따른 해결 방안까지 논리적이고 객관적인 방법으로 설명하는 것이다. 유능한 분석가가 되고 싶다.

 

A. 주제

AI의 핵심은 데이터, 데이터를 이해하는 도메인 전문가 역할이 중요(SEOUL 2024), 권용만, IT조선, 2024.02.02

https://it.chosun.com/news/articleView.html?idxno=2023092109667

 

“AI의 핵심은 데이터, 데이터를 이해하는 도메인 전문가 역할이 중요” [AI SEOUL 2024]

“AI의 핵심은 데이터다. AI를 산업에 적용하는 데 있어서는 관련 분야와 데이터를 잘 이해하는 ‘도메인 전문가’의 역할이 중요하다.”이현규 정보통신기획평가원(IITP) PM 그룹 민간전문가는 1

it.chosun.com

 

B. 요약

AI 기술의 성공적인 적용을 위해 데이터와 도메인 전문가의 협력이 필수적이다. AI 기술이 단순히 기술로만 존재하는 것이 아니라, 산업별 맞춤형 솔루션으로 발전하기 위해서는 각 분야의 전문 지식과 데이터를 통합하는 것이 중요하다.

 

C. 핵심 내용

2월 1일 글로벌 컨퍼런스 'AI 서울 2024'는 AI 기술의 산업 적용과 도메인 전문가의 협력, 클라우드 플랫폼의 역할, 데이터 중심 조직의 필요성 등을 다루며, AI의 미래 방향성을 제시했다.

 

1. AI의 핵심과 도메인 전문가의 중요성:
이현규 정보통신기획평가원(IITP) PM 그룹 민간전문가는 AI 기술이 단순한 기능일 뿐, 산업에 적용하기 위해서는 도메인 전문가의 역할이 중요하다고 강조했다. 현재 AI 활용률은 2.7%로 낮으며, 이는 기술에 대한 과도한 기대와 기존 방식에 대한 집착 때문이라고 지적했다.

2. 기술 활용의 시기와 데이터의 중요성:
AI 기술은 적절한 시점에 사용해야 성공할 수 있으며, 데이터의 중요성을 간과해서는 안 된다고 말했다. 알고리즘 전문가와 도메인 전문가의 협력이 AI의 일상화와 대중화에 필수적이라고 강조했다.

3. AI와 클라우드의 역할:
정태일 구글 클라우드 코리아 커스터머 엔지니어는 구글 클라우드가 AI 활용을 위한 빅데이터 수집과 활용을 지원하며, 온프레미스 환경 없이도 AI 환경을 구축할 수 있다고 설명했다. 주요 제품으로는 빅쿼리와 버텍스 AI를 소개했다.

4. 생성형 AI와 데이터 중심 조직:
김기병 아마존웹서비스(AWS)코리아 매니저는 생성형 AI 시장에서 데이터 활용과 기업 특화 애플리케이션의 중요성을 강조했다. 데이터 중심 조직으로의 변화가 필요하며, 이를 통해 프로토타이핑과 인프라 비용 문제를 해결해야 한다고 말했다.

5. AI 서비스 사례: 클로바 케어콜:
옥상훈 네이버클라우드 AI SaaS 비즈니스 리더는 고독사 방지를 위한 AI 전화 서비스인 '클로바 케어콜'을 소개했다. 초기 챗봇 기반에서 초거대 AI로 발전하여 대화의 자연스러움과 업무 효율성을 높였으며, 향후 건강 관리와 IoT 디바이스와의 결합을 계획하고 있다고 밝혔다.

 

D. 도메인과 AI 전문가, 그리고 나

건축 및 도시계획 분야에서 데이터 분석가가 되기 위한 내용을 AI에게 물어본 대답을 정리하면 아래와 같다.


필요한 능력
1.데이터 분석 기술
- 통계학 및 수학적 기초: 데이터 분석의 기초 지식
- 프로그래밍 언어: Python, R, SQL 등 데이터 처리 및 분석을 위한 언어 이해

2. GIS(지리정보시스템) 기술

- GIS 소프트웨어(ArcGIS, QGIS) 활용 능력.

3. 데이터 시각화
- Tableau, Power BI 등의 도구를 사용하여 분석 결과 전달.

4.문제 해결 능력
- 복잡한 문제를 정의하고 데이터 기반 해결책 제시.

5. 커뮤니케이션 능력
- 분석 결과를 이해하기 쉽게 설명하고 다양한 이해관계자와 소통.

필요한 자격증
1.데이터 분석 관련 자격증
- Google Data Analytics Professional Certificate
- Microsoft Certified: Data Analyst Associate

2.GIS 관련 자격증
- Esri Technical Certification
- GIS Professional (GISP)

3. 통계 및 데이터 과학 관련 자격증
- Certified Analytics Professional (CAP)
- SAS Certified Data Scientist

추가적인 학습 및 경험
- 학위: 도시계획, 건축학, 데이터 과학, 통계학 등 관련 분야의 학사 또는 석사 학위

- 인턴십 및 프로젝트 경험: 실무 경험과 포트폴리오 구축

관련 기업
1.건축 설계 회사
- 삼우종합건축사사무소, 현대건설

2. 도시계획 및 설계 회사
- 도시건축연구소, 한국토지주택공사(LH)

3. GIS 회사
- 에스리코리아, 지오시스

4. 컨설팅 회사
- 삼정KPMG, 딜로이트

5. 정부 및 공공기관
- 서울특별시청, 국토교통부

A. 주제

'머신러닝' 기초 지식 톺아보기, 곰씨네IT블로그, 2024.05.31

https://yozm.wishket.com/magazine/detail/2611/

 

‘머신러닝’ 기초 지식 톺아보기 | 요즘IT

인공지능(AI)과 머신러닝(ML) 기술의 급속한 발전은 소프트웨어 개발 프로젝트에 큰 변화를 불러오고 있습니다. 이러한 변화는 개발자들에게 새로운 숙제를 안겨주는 동시에 많은 기회를 제공할

yozm.wishket.com

 

B. 요약

머신러닝은 데이터를 분석하고 학습하여 예측하는 기술로, 지도학습, 비지도 학습, 강화학습으로 분류한다. 개발 프로세스는 데이터 수집과 전처리, 모델 학습과 평가, 모델 배포와 유지보수로 구성한다. 추천 시스템, 이상 탐지, 자연어 처리, 이미지 인식 등 다양한 분야에서 활용한다. 

 

C. 핵심포인트

머신러닝 정의: 알고리즘을 이용해 데이터 분석 및 그 결과를 스스로 학습하여 판단과 예측을 하는 기술.

 

1. 인공지능 > 머신러닝 > 딥러닝

- 인공지능(AI): 인간의 지능을 모방하는 기술.
- 머신러닝(ML): AI 구현 방법.
- 딥러닝(DL): 인공신경망을 기반으로 한 ML의 한 종류. 대규모 데이터 처리, 이미지 및 음성 인식에 주로 사용된다.

 

2. 머신러닝의 분류

- 지도학습: 레이블이 있는 데이터를 사용하여 모델 학습 (예: 분류, 회귀).
- 비지도 학습: 레이블이 없는 데이터로 구조나 패턴을 발견 (예: 클러스터링, 차원 축소).
- 강화학습: 환경과 상호작용하며 보상을 최대화하는 방식.

 

3. 머신러닝 개발 프로세스

1) 데이터 수집과 전처리: 데이터 분할, 결측값 처리, 이상치 제거.
2) 모델 선택 및 학습: 데이터 특성에 맞는 알고리즘 선택 (예: 선형회귀, 의사결정나무).
3) 모델 평가 및 검증: 분류 문제는 정확도, 정밀도; 회귀 문제는 평균제곱오차 등.
4) 모델 배포와 유지보수: 검증된 모델 배포, 모니터링, 업데이트.

 

4. 머신러닝 활용 사례

- 추천 시스템 개발.
- 이상 탐지 및 부정행위 감지.
- 자연어 처리와 감성 분석.
- 컴퓨터 비전과 이미지 인식 (의료 영상 진단, 자율주행 차량 등).

 

D. 용어정리

- 레이블(label): 학습데이터의 정해진 특징 (분류결과가 정답이 될 데이터)

ex) 고양이 이미지와 강아지 이미지를 주고 분류하는 머신러닝을 만든다고 가정한다.

이 때 학습에 사용하는 데이터가 강아지인지, 고양이인지 알려주는 정답을 레이블이라 한다.

- 하이퍼파라미터(Hyperparmeter): 모델의 구조나 학습과정을 제어하는 각종 변수들을 의미한다.

- Training Dataset : The sample of data used to fit the model

- Validation Dataset: The sample of data used to provide an unbiased evaluation of a model fit on the training dataset while tuning model hyperparameters. The evaluation becomes more biased as skill on the validation dataset is incorporated into the model configuration

- Test Dataset: The sample of data used to provide an unbiased evaluation of a final model fit on the training dataset.

   → 완전하게 모델이 훈련되었을 때, 딱 한 번만 사용한다.

 

E. 마무리

- 다양한 머시러닝 알고리즘

- 텐서플로우(TesnsorFlow), 파이토치(PyTorch) 같은 머신러닝 라이브러리 및 프레임워크

- 각종 통계 및 수학

- 데이터 처리 기법

 

- 아직 갈 길은 멀고, 배워야 할 것은 산더미이다.

A. 주제

스토리텔링이 있는 긴 글을 어떻게 쓰는 걸까?, 김도영, 2024.04.19

https://yozm.wishket.com/magazine/detail/2552/

 

스토리텔링이 있는 긴 글을 어떻게 쓰는 걸까? | 요즘IT

보통 브랜딩이나 마케팅 관련 일을 하는 분들은 글에 대한 관심도가 높은 편입니다. 볼거리, 즐길 거리가 넘쳐나는 시대이지만, 여전히 책이나 잡지처럼 텍스트로 된 콘텐츠를 즐기는 분들도

yozm.wishket.com

 

B. 요약

 이 글은 긴 글쓰기를 두려워하는 이들을 위해 조언을 제공한다. 효과적인 스토리텔링을 통해 독자의 흥미를 유지하고, 글의 목적을 명확히 하여 독자를 설득하는 것이 중요하다. 긴 글쓰기를 연습하기 위해 문단을 적절히 구성하고, 이야기의 흐름을 말로 설명해보는 것이 좋다. 또한, 임팩트 있는 메시지를 전달할 수 있도록 글의 구조를 이해하는 것이 필요하다.

 

C. 주요 포인트

 스토리텔링과 긴 글쓰기 모두 타인을 이해시키거나 설득하기 위한 공통된 목표를 가지고 있다. 이 과정에는 일정한 시퀀스가 존재한다. 특히 긴 글은 깊이 있는 메시지를 효과적으로 전달하는 데 유용하다.

 

긴 글을 잘 쓰기 위한 방법
1. 문단 나누기: 글을 작성할 때 문단을 명확히 나누어 각 주제를 구분하고, 독자가 내용을 쉽게 이해할 수 있도록 한다.
2. 구조적 접근: 글의 주요 메시지를 중심으로 구조를 잡아야한다. 핵심 메세지를 명확히 하고 그에 맞추어 내용을 전개하는 것이 중요하다.
3. 말로 정리하기: 글을 쓰기 전에 내용을 말로 정리해본다. 이 방법은 생각을 정리하고 글의 흐름을 자연스럽게 구성할 수 있다.
4. 임팩트 있는 구성: 독자에게 강한 인상을 남길 수 있는 글을 구성하는 것이 중요하다. 효과적인 메시지를 전달하기 위해 각 문장을 신중하게 선택하고 배치해야 한다.

 분량이나 포맷보다는 글쓰기의 접근 방식이 중요하다. 전달하고 싶은 메시지를 명확히 하며 글의 구성과 짜임새를 고민하는 것에서부터 시작하고자 노력하여야 한다. 

D. 용어 정리

시퀀스: 하나의 상황이 시작되어 끝나는 곳까지 독립된 구성단위

시퀀스는 각 학계에서 쓰이는 뜻이 다르다. 교육계에서는 '학습에서, 단원이 발달하여 가는 차례' , 영화계에서는 하나의 이야기가 시작되고 끝나는 독립적인 구성단위로, 극의 장소, 행동, 시간의 연속성을 가진 몇 개의 장면이 모여서 이루어짐' 을 말한다. 카드놀이에서는 숫자가 연속된 석 장 이상의 같은 종류 카드를 시퀀스라 부르기도 한다.

sequence 연속적인 사건들, 차례로 배열하다, 배열 순서를 밝히다 등의 단어 뜻으로 설명되며, 영화에서 연속성 있는 하나의 주제, 정경으로 연결되는 장면을 시퀀스라 정의하기도 하였다.

 

A. 주제

그 데이터는 잘못 해석되었습니다, freak analyst, 2022.12.07

그 데이터는 잘못 해석되었습니다 | 요즘IT (wishket.com)

 

그 데이터는 잘못 해석되었습니다 | 요즘IT

무엇이든 데이터가 있으면 쉽게 결정을 내릴 수 있을 것 같습니다. 하지만 현업에서는 데이터가 있어도 결정을 내리기 어려운 상황들이 있습니다. 특히 데이터를 통한 의사결정을 내릴 때, 가장

yozm.wishket.com

 

B. 요약

데이터 해석 시 생존자 편향, 심슨의 역설, 상관 관계의 성급한 일반화 등 인지 편향적 오류를 범할 수 있다. 이를 방지하기 위하여 목표에 맞지 않는 지표를 선택하지 않도록 주의하며, 명확한 목표와 적합한 지표를 통해 올바른 의사결정을 내려야 한다. 또한, 충분한 근거를 확보하고 잘못된 해석의 가능성을 인지하는 세이건 표준을 참고하는 것도 좋은 방법이다. 

 

C. 주요 포인트

1. 데이터를 잘못 해석하는 상황별 유형

1) 생존자 편향의 오류

- 잘못된 지표설정과 해석은 고객의 이탈 등의 결과 초래한다.

- 전체 대상을 기준으로 잡아야 올바른 지표에 따른 해석이 가능하다.

 

2) 심슨의 역설

- 전체 지표와 그룹을 나눈 지표의 방향성이 다르게 나타나는 상황을 말한다.

- 집단을 나누어 그 특성에 따른 기준을 미리 정하고 그 기준으로 지표를 살펴보는 것이 효과적이다.

 

3) 상관관계를 통한 성급한 일반화

- 상관성은 있으나 인과성이 없는 경우 제 3의 공통 원인이 존재할 수 있어 성급한 일반화는 데이터 해석 오류를 초래한다.

- 사용자의 행동과 심리를 인지적으로 구조화하고 두 지표에 동시에 영향을 미치는 공통 원인을 살핀다.

- 새로운 구조로 지표 간의 관계를 파악하는 과정이 필요하다.

 

4) 목적에 맞지 않는 지표 선택

- 명확한 목적을 가지고 어떤 방식으로 프로젝트를 풀어나갈 것인지를 고민해야 한다.

- 목적에 맞는 지표는 제대로 된 의사결정을 가져온다.

 

2. 세이건 표준 참고

- 데이터를 잘못 해석하지 않기 위해 칼 세이건의 세이건 표준을 참고하는 것을 추천한다.

- 데이터를 특별한 주장으로 연결시키기 전 충분한 근거를 확보하였는지, 데이터를 잘못 해석했을 가능성은 없는지, 인지적으로 노력하는 과정이 무엇보다 중요하다.

 

D. 용어 정리

- 생존자 편향: 소수의 성공한 사례를 일반화된 것으로 인식함으로써 나타나는 편향

- 심슨의 역설: 여러 그룹의 자료를 합했을 때의 결과와 각 그룹을 구분했을 때의 결과가 다른 오류

- CTA(Call To Action) : 유저의 행동을 유도하는 버튼

- 인지 편향: 경험에 의한 비논리적 추론으로 잘못된 판단을 하는 것

 

 

A. 주제

: 개발 블로그는 어떻게 써야할까?,F -Lab & Company,2022.07.13

개발 블로그는 어떻게 써야할까? (f-lab.kr) 

 

B. 요약

개발자는 블로그를 운영하는 목적을 분명히 하여야한다 이야기하며 글 작성법을 소개하였다.

 

C. 주요 포인트

1. 공부한 내용을 공유하기

- 어려운 개념을 잘 정리하여 공유하면 기술력을 인정받을 수 있다.

- 단순한 클래스 사용법이나 다른 블로그 내용을 재정리한 글은 한계가 있다.

 

2. 활용한 내용을 적기:

- 이해가 중요한 개발에서는 공부한 내용을 실제 프로젝트에 어떻게 활용했는지 공유하는 것이 중요하다.

- 특정 개념을 프로젝트에 적용하여 개선한 경험을 공유하는 것을 추천한다.

 

3. 깊이 있는 개념 정리하기

- 단순한 개념 소개보다는 내부 메커니즘까지 깊게 다룬 글이 더 유익하고 높은 평가를 받을 수 있다.

 

4. 공유 목적의 글 작성

- 블로그는 다른 사람들과 경험과 지식을 공유하는 공간이다.

- 다른 사람들이 이해하기 쉽도록 글을 작성해야 한다.

 

 

A. 주제

주제: 데이터 기반 의사결정의 장점, 요즘IT의 번역글, 2021.09.27

https://yozm.wishket.com/magazine/detail/1051/

 

데이터 기반 의사결정의 장점 | 요즘IT

데이터 기반 의사결정은 의사결정을 내리기 전, 데이터를 활용해서 이대로 진행해도 무리가 없는지 체크하여 행동 방침을 승인하는 과정을 의미합니다. 데이터 기반의 의사결정은 분명 수많은

yozm.wishket.com

 

B. 요약

데이터 기반을 통한 의사결정은 리스크를 줄이고 효율적인 결정을 할 수 있다는 장점이 있다.

 

C. 주요포인트

1. 데이터 기반 의사결정을 하는 이유

- 발생 가능한 리스크를 파악하고 확신을 가지고 의사결정을 내릴 수 있다.

- 데이터를 근거로 문제점을 파악하고 타인과 효과적인 의사결정이 가능하다.

- 비용 절감 효과가 있다.

 

2. 데이터 기반 업무 처리를 위해서 해야하는 것

- 분석적인 사고를 하기 위해 노력하며 예상치 못한 지점에서 패턴을 찾아야 한다.

- 직관이 아닌 데이터 기반의 결정하여야 한다.

- 데이터 시각화하여 데이터의 특성을 알아보기 쉽게 나타낸다.

 

D.용어 정리

1. 데이터 중심 의사 결정(DDDM, Data-Driven Decision-Making): 기업이 의사결정을 하는 과정에 직감이나 리더의 개인적 판단이 아닌 데이터를 분석해서 체계적으로 판단하는 회사의 운영 체제

 

A. 주제

데이터 분석가가 되어보니 중요한 것, freak analyst,2023.01.13

데이터 분석가가 되어보니 중요한 것들 | 요즘IT (wishket.com)

 

B. 요약

데이터 분석가는 조직이 하는 일과 결과에 대하여 구성원들이 파악하여 지표를 기반으로 성공확률이 높은 의사결정을 할 수 있도록 비즈니스에 필요한 주제의 분석하는 사람이다.

 

C. 주요포인트

데이터 분석가: 데이터를 기반으로 성공확률이 높은 의사결정을 하도록 돕는 사람

 

1. 데이터 기반

- 데이터를 쉽게 확인할 수 있고, 주요 지표의 진행 상황을 알 수 있도록 기반이 만들어져야 한다.

- BI 툴 도입: 대시보드를 만들어 지표들의 정보를 읽기 수월해져야한다.

- SQL 교육을 함으로써 비데이터 직군이 데이터를 이해하고 깊이 있는 분석이 가능하다.

- 데이터마트를 만들어 목적에 따라 가공한 데이터들을 쉽게 찾을 수 있도록 해야한다.

- 모든 구성원이 현재 상황을 파악하고 공유 가능하다는 장점이 있다.

 

2. 성공할 확률이 높은 의사결정

- 상황을 정확하게 해석하기 위하여 회사의 정보를 축적하고, 합리적인 형태로 구조화가 필요하다.

- 목표 설정을 통해 구성원들의 몰입을 이끌어내었다.

- 성과측정을 통해 조직에서 의도적으로 만든 변화로 인해 결과가 어떻게 바뀌었는가 실험이 가능하였다.

 

3. 지속성

- 비즈니스 사이클에 맞게 분석해야한다.

- 분석 주제가 현재 회사가 집중하는 것과 같아야한다.

- 분석 주제의 결과물이 비즈니스 사이클에서 필요한 적절한 것이어야 한다.

 

결론: 데이터분석가가 본 데이터 분석가는 조직의 의사결정의 퀄리티를 높이는 사람이다.

 

D. 용어 정리

1. 데이터 마트: 조직의 사업부와 관련된 정보를 포함하는 데이터 스토리지 시스템

2. 데이터 스토리지

- 세부 데이터와 디지털 정보를 실제로 수집하고 보관하는 장소

- 빅데이터와 데이터 관리의 핵심 구성 요소

- 종류: 소프트웨어 정의 스토리지, 클라우드 스토리지, 네트워크 연결 스토리지, 오브젝트 스토리지 등

3. 도메인 지식: 회사가 속한 산업, 상품 혹은 서비스에 대한 지식

+ Recent posts