기조
복잡계 연구 대상
사회/인터넷 IT/생명현상
... 과학적으로 연구될 수 있을까??
부품이 아닌 전체의 개념... 네트워크
네트워크를 통해 복잡계가 구현된다.
어떻게 연결됐는지 알기 위해 데이터 필요
"데이터는 신인가?"
구글이 최고
예)브라우져별 청화대 조회
구글 트렌드 예)다이어트 1월1일 가장 높음
데이터는 묶어서 파악
사진 : 루머와 진실
사람와 인공지능의 대결이 아닌 함께 협업하면 더 좋은 결과
블럭 체인
데이터는 연결될 수록 막강
영문법을 알려면 영문학과가 아닌 구글에 취직
구글로 주식
지난 3주 빚 경제 늘면 주식 판매
수익률 326%
경제 tv 33%
빅데이터의 함정.. 상관관계와 인과관계
장기예측은 무의미할 수도...
머신러닝
학습 알고리즘...학습
적정한 학습
실행
.... 이건 진화
미디어에 가장 많이 활용
collaborative filtering... 추천 아이템
유사품을 계산하려 구입하지 않은 것을 필터링
와우북...참담 ... 속도의 문제
... 하드웨어 발전/
아이템 기반 사용... 사용자 기반이 좋으나 개인정보 문제ㅡ
딥 러닝
이상징후 사례가 드물어 딥 러닝 어려움
데이터의 부정확도를 위해 머신러닝. collaborative filtering로 개선
많은 데이터 필요
저렴
..... 현장에선 어려운 일
클라우드 기반이 아니면 비용 감당 못함
데이터를 읽을 때부터 ....
호환 기술이 핵심
-> 전환... 성능 분석
클라우드가 답!!!
빅데이터
역사(2012년??)는 오래됐지만 성과는 크지 않음
산업혁명 4.0
빅데이터
역사(2012년??)는 오래됐지만 성과는 크지 않음
산업혁명 4.0
13:10
클라우드로 전환.... 보안문제 상승
3. 어떤 클라우드에 옮길 것인가???
지역에 따라 적용 법규가 틀림
... 유출 사고 등
클라우드 사업자는 데이터 보호에 대한 직접적인 의무가 없다.
백업 등 관리도 클라우드 사업자의 책임 아님
지역별로 분산된 클라우드 사업자도 감안
... 속도 등 이유로
RDS(아마존)... 데이터만 서비스
Azure(MS)
Chakra MAX
상시 모니터링이 중요
Galea(암호화 solution)활용
물리적 위치가 법규에 매우 중요
사업자와 고객의 역할
암호화 탐색 지속
15:00
분석틀의 트렌드 변화
분석 못하는 사람을 위한 트렌드에서 개발자 중심으로
분석분야 open source 많음
통계학적 머신러닝은 실제 분석에서 어려움
공장 장비가 어떤 데이터가 쌓일때 오류(고장)로 봐야하는 지 빅데이터로 분석
공공은 빅데이터이기보다 통계학적 분석임... 민간은 자료가 많으므로 빅데이터
반도체 : 부품의 품질 검증
빅데이터는 사후 분석
상태분석 등을 통해....
현재 인공지능 빅데이터, ?? 개념으로 저렴해짐...
... CNN RCC 알고리즘 주로 사용
딥러닝 활용
추론, 예측에 관심(고장, 불량 예측)
... 이미지 인식 활용
공공데이터는 대부분이 공간데이터(주소 기반)
입지선정을 위해
고군위는 진입 어려움
골목 상권에 대한 관심 높음
유동, 카드 사용 등 소비 패턴으로
유용한 상권 발굴 기능
역세권이 유리했으나
경기 하락으로
주거지역 원룸... 상권 소비가 늘어남을
분석을 통해 가시화
*** 경찰청 범죄 지수
warning index.... 둥지내몰림 시 경고
비정형데이터=텍스트,
음성, 이미지 데이터
.... 분석이 매우 어려움... 정확도 60% 이하이므로..... 택스트에 의존
채팅로봇=챗봇
정형데이터에 비정형데이터를 추가하여 결과 더 좋음
가장 중요한 것.... 한글 전처리
나의 iPhone에서 보냄
'잡기' 카테고리의 다른 글
나의 콜롬비아 커피농장 여행기(글.사진 이승민) (0) | 2017.09.11 |
---|---|
제4차 산업혁명 대비 청소년직업체험 프로그램 운영방안 (0) | 2017.05.29 |
코액스2 (0) | 2017.04.03 |
김영사 행사ㅐ (0) | 2017.04.03 |
카페 뮤제오 써포터즈 2016 서울 카페쇼 (0) | 2016.11.01 |