4.최종 보고

                    종합설계 프로젝트 최종보고서 요약

팀명

 마음은 Jobs 코딩은 Pass

제출일

2013 5 28

프로젝트 제목

 Web Page Crowd Media based on Twitter

설계 프로젝트 개요

프로젝트 수행 내용 및 중간 결과

프로젝트 요약문

수 많은 목소리가 합쳐져 만들어진 Crowd Media의 가장 큰 특징은 다양성이다. 본 프로젝트는 Crowd Media를 사용하여 관심 지역에서 일어나고 있는 일들 중에서 유용한 것들을 사용자에게 알려주는 것을 목표로 하고 있다. 또한 다음 카페, 네이버 블로그, 트위터 등과 연계하여 관련 게시물을 정리하여 표현함으로써 만족스러운 정보를 제공한다.

마일스톤 수행 내용

1. 관련 이미지 검색 추가

2. 통계 추가

3. 모바일용 웹페이지 제작

4. UI

항목

기간

5

비고

대분류

소분류

1

2

3

4

웹 페이지

이미지 검색

 

 

 

 

 

통계

 

 

 

 

 

모바일용 웹페이지 제작

 

 

 

 

 

세련된 UI

 

 

 

 

 

디버깅 및 테스트

 

 

 

 

 

형태소 분석기

 

 

 

 

 

    계획서 상의 마일스톤 진도와 일치

최종 보고 요약

1.     시스템 구조

u  Python – Insert

-       Load a XML file: 지도 상에 마커를 표시하기 위해 해당 지점에 대한 좌표 정보를 가지고 있는 location.xml 파일을 불러온다.

-       Station Info: location.xml을 파싱하여 위치명, 위도, 경도를 추출한다..

-       Connect to the DB: python에서 데이터베이스에 접속하고 위치정보를 저장하기 위해 query를 보낸다.

-       Insert data of stations to the table: 데이터베이스의 locations 테이블에 위치 정보를 삽입한다.

u  Python – Insert words to the DB

-       Extract twitter’s articles: 제시한 단어와 연관된 트위터 글을 가져온다.

-       Bring only Noun : 전달된 인자의 형태소 분석 처리 결과인 단어들을 반환받고 이를 파이썬 변수에 저장한다..

-       Refine the article: 트위터 글을 형태소 분석기를 통해 필요한 단어 뭉치들로 나누고 여기에서 필요 없는 단어는 제거한다.

-       Connect to the DB: Database에 접속하여 단어를 저장하기 위한 query를 정의한다.

-       Insert articles to the table: 필요한 단어를 저장하기 위해 빈도수가 높은 순서로 최대 30개까지만 데이터베이스의 key_list 테이블에 삽입한다.

u  Database

-       Table: locations: lat는 위도(Latitude)를 의미하고 lon은 경도(Longitude)를 의미하고 각각 해당 값이 저장된다. loc_name은 그 좌표에 해당하는 지역명을 나타낸다.

-       Table: key_list: local 에는 지역명, word 에는 단어, freq 에는 빈도수, sen_id 에는 문장의 고유 식별 번호를 의미한다.

u  Web

-       Display a map: 네이버 map API를 불러와서 웹 페이지에 표현한다.

-       Show related word: 관련 단어 5개를 시각적으로 보기 편하게 나타낸다.

-       Search Blog, Café, Twitter: 네이버 블로그, 다음 카페, 관련 트위트 글을 한눈에 알아 볼 수 있게 항목별로 제공한다

2.     성능 평가

 Trends map과 비교해서 정확도 높은 단어들을 추출할 수 있는 것을 확인하였다. 하지만 많은 단어들을 저장하면 서버에 과부하가 걸려 속도저하의 원인으로 판단했다. 때문에 실시간으로 업데이트 하는 것에 한계가 있다고 판단했다. 시간이 지난 키워드들은 빈도   수에 따라 삭제하는 순서를 정하여 삭제하며 서버의 과부하를 줄이는 방법을 택했다.

프로젝트 결과     *주소: http://203.246.112.77/main.php
처음 웹페이지 화면
지하철역 마커를 클릭하면 키워드가 원그래프 형태로 보여진다.
원그래프에서 키워드를 클릭하면 그 단어의 추가적인 정보들을 볼 수 있다. 
추가적인 정보들로는 트위터 타임라인, 네이버 블로그, 다음 카페, 이미지 검색이 있고, 그 지역에서의 5일 간의 키워드들의 통계도 볼 수 있다.
 

동영상

  • YouTube 동영상


 

Ċ
16조 캡스톤,
2013. 5. 28. 오전 3:46
Ċ
16조 캡스톤,
2013. 5. 28. 오후 4:52
Ċ
16조 캡스톤,
2013. 5. 28. 오전 3:46
Comments