🧑‍💻 IT 범생이 Finn 18

꼭 알아야 하는 머신러닝 필수 개념 (1): 기초용어 및 활용분야 예시

머신러닝이 대세다! 라고 들었을때 공부했어야 했는데, 라고 생각했을때 공부했어야 했는데... 라는 생각이 많이 드는 요즘이다. 마냥 외국어 같던 머신러닝도 어느덧 석사 중반에 접어들며 '익숙한' 개념이 되었지만, '정확히 알고 있는' 개념은 아닌지라 짬을 내어 정리해 두고자 한다. MIT Press 에서 발간한 '머신러닝 기초'를 보조 서적으로 읽고 있다. 나름 머신러닝 주류 개념에 대한 정리가 잘 되어있는 자료라고 들어 보고 있는데, 무엇보다도 평소 혼용해서 사용하고 있던 여러 용어에 대한 스스로의 부족함을 뼈저리게 느낄 수 있었다. '어중간하게 아는게 가장 무섭다'는 말이 있듯이 돈만 쓴 바보 석사생이 되면 안되겠다는 결심으로 한두장씩 거북이처럼 읽어가고 있다. 머신러닝이란? 머신러닝이란, 경험에 기..

빅데이터 분석기사 정보 및 필기 시험 후기 분석 (기출 문제 정리)

안녕하세요 IT 범생이 Finn 입니다~! ​ 최근 4차 산업혁명 및 데이터에 대한 관심이 높아지며 자기계발 혹은 취업의 목적으로 데이터 관련 자격증을 알아보시는 분들이 많은데요, ​ ​ 오늘은 요즘 많은 분들이 관심을 갖고 준비하시는 빅데이터 분석기사 시험에 대한 정보 및 1회 시험에 대한 후기를 분석하고자 합니다. ​ ​ '빅데이터 분석기사' 란? ​ 한국데이터산업진흥원에서 시행하는 빅데이터분석기사 시험에 합격한 자를 말합니다. ​ 기존의 데이터 자격증 하면 흔히 데이터분석 준전문가(ADsP)를 많이 떠올리실 텐데요, ​ ADsP는 국가 공인 민간자격증인 반면, 빅데이터 분석기사는 국가기술자격증으로 분류되어 보다 높은 수준의 공신력을 보유하고 있습니다. ​ ​ 필기시험은 '과목 당 40점 이상' 그리..

딥러닝 필수개념: 텐서 TENSOR 이해하기

​ 안녕하세요 IT 범생이 Finn 입니다~! ​ 오늘은 다차원 데이터 형태 중에서도 악명이 높은 텐서 (Tensor) 데이터에 대해 정리해 보고자 합니다. 사실 텐서는 텐서플로우가 유명해지며 데이터를 공부하는 사람들 사이에서 유명해진 단어인데요. 정작 텐서가 무엇인지 모르면서 텐서플로우를 사용하는 경우가 잦은것 같아, 정리를 위해 포스팅을 하게 되었습니다. 텐서는 물리학에서도 함께 사용되는 만큼 본 포스팅은 데이터의 영역에 국한하여 최대한 쉽게 정리해 보고자 합니다. ​ ​ 텐서란 무엇인가? 컴퓨터 과학에서 배열 (array)는 번호 (index)와 각 번호에 대응하는 값들로 이루어진 데이터 형태를 말합니다. Numpy 혹은 Pandas를 사용해 보신 분들이라면 가장 기본적으로, 또 많이 다루어 보셨을..

SQL보다 먼저 배워야 하는 데이터 전처리 3단계 (빅데이터 분석기사 자격증 준비)

안녕하세요 IT 범생이 Finn 입니다 ~ ! ​ 오늘은 데이터 분석의 핵심적인 과정인 데이터 전처리에 대해 정리해 보고자 합니다. ​ ​ 빅데이터, 데이터베이스 등의 개념이 보편화되며 많은 분들이 SQL, 빅데이터 분석기사 자격증 등을 공부하고있는데요. 어쩌면 데이터 분석의 전 과정 중에서 가장 생소하고 또 접해보지 못하셨을 영역이 바로 데이터 클리닝, 혹은 데이터 전처리 일 것으로 생각됩니다. ​ 빅데이터 분석기사 시험 영역에서도 중요한 부분을 차지할 만큼 SQL, DB를 배우기 전에 꼭 알아야 하는 개념입니다! ​ 그렇다면 데이터 전처리가 무엇이고, 어떻게 접근해 나가야 하는지 함께 알아보아요! ​ ​ 데이터 전처리가 중요한 이유 우리는 일상 속에서 다양한 형태로 데이터를 발생시키고 수집합니다. 기..

리플 vs SEC 소송전의 결과는? 투자 전 꼭 알아야하는 리플 상식 (XRP)

오늘날 세계가 웹에서 '정보'를 움직이듯이 우리는 세계가 '가치'를 움직일 수 있도록 노력한다 - 리플의 슬로건- 이 글은 특정 암호화폐의 투자를 권하거나 추천하기 위함이 아닙니다! 오히려, 각 암호화폐의 개설 취지 및 기술 자체에 대한 객관적인 정보를 주어, 해당 화폐에 대한 개인 스스로의 이해도를 증진함이 목적입니다. 오늘은 리또속 (리플에 또 속았다!) 라는 안쓰러운 오명으로 거래되는 암호화폐 리플에 대한 정보를 제공하고자 합니다. 누가 만들었는가? 리플은 제드 맥칼렙, 크리스 라센을 비롯한 여러 공동 창업자들에 의해서 고안되었다. 이 두명을 별도 언급하는 이유는 그들이 리플의 설립에 핵심적인 역할을 했기 때문이다. 제드 맥칼렙은 미국의 프로그래머로, P2P 파일 전송 서비스인 edonkey2000..

NFT와 디파이는 이더리움 기반이다? 투자 전 꼭 알아야하는 이더리움 상식 (ETH)

블록체인 기술의 가장 큰 장점이 '안전성'인 반면, 새로운 기술에 대한 사람들의 신뢰는 대개 낮은 편이다. 우리는 이런 모순을 피해갈 수 없다. - 비탈릭 부테린 이더리움 창업자 - 암호화폐에 대한 관심이 매우 높은 요즘입니다. 일론머스크는 어느덧 테슬라보다 비트코인의 대명사가 되었고, 너도나도 무슨 코인을 샀다는 말을 심심찮게 들을 수 있는데요, 이 글은 특정 암호화폐의 투자를 권하거나 추천하기 위함이 아닙니다! 오히려, 각 암호화폐의 개설 취지 및 기술 자체에 대한 객관적인 정보를 주어, 해당 화폐에 대한 개인 스스로의 이해도를 증진함이 목적입니다. 오늘은 시가총액 (해당 암호화폐의 총 발행 개수 X 평균 시장 금액) 기준 비트코인에 이어 2위를 달리고 있는 이더리움에 대한 정보를 제공하고자 합니다...

미국 조지아텍 OMSA 온라인 석사를 선택한 이유 (데이터 사이언스 석사)

작년 8월에 입학하여 일과 석사생활을 병행 중이다. 이제 선형 대수학은 제법 익숙한데, 아직 많이 부족한 미적분 실력을 다듬기 위해 '수능특강 - 미적분'을 풀고 ebs로 해설을 듣고 있다. 회사 다닐때의 대략적인 생활 패턴은 아래와 같지 않을까...? 다행히 퇴사하고 입사 전 자유시간이 있어 편하게 공부하는 중이다. 오후 6시 - 퇴근 오후 7시 - 저녁 먹고 낮잠 시작 오후 9시 - 공부를 위해 기상 새벽 2시까지 공부하고 취침 각설하고, 왜 수많은 과정 중에서 조지아텍 OMSA 과정을 선택했는지 적어보고자 한다. OMSA or OMS Analytics: Online Masters of Science in Analytics Georgia Institute of Technology, 줄여서 조지아텍은 ..

문과 마케터가 데이터 과학 석사를 지원한 이유 (데이터 사이언스 석사)

머신러닝, 인공지능, 딥러닝... 바야흐로 데이터가 경쟁력이 되는 시대다. 학부시절 빅데이터라는 단어를 처음 접한 후 꾸준히 데이터에 대한 관심은 있었으나, 딱히 깊이있게 공부할 엄두는 나지 않았다. 그러던 내가 3년차 브랜드 마케터가 아래 세가지 이유로 데이터 과학, 그것도 석사 과정을 지원하게 되었다. 하나. 데이터는 앞으로 더더욱 중요해 질 것이다 마케팅에서 앱서비스, 디지털 매체를 관리하며 소비자에 대한 정보를 소름돋을 수준까지 획득할 수 있음에 적잖은 충격을 받았다. 광고를 집행한 후 잘되면 내 덕, 안되면 다른 “논리적인” 이유를 찾기 급급했던 전통 마케팅?의 시대를 지나, 이제는 바로 다음날 (떨리는 마음으로) 실시간 반응/결과를 확인할 수 있는 퍼포먼스 마케팅의 시대가 아닌가! 백날 회의실..