시간대별 이슈를 쉽게 추적하는 방법
뉴스 키워드를 수동으로 정리하던 시대는 지났습니다.
이 글에서는 뉴스 키워드를 자동으로 수집하고, 시간대별로 분석하여 시각화하는 시스템을 소개합니다. 매시간 주요 언론사의 RSS를 통해 뉴스 데이터를 수집하고, 가장 많이 언급된 단어를 분석해 보여주는 구조입니다.
📰 뉴스 키워드 자동화 시스템, 왜 필요한가요?
포털사이트에는 실시간 급상승 검색어가 있지만, 실제 뉴스 제목에 어떤 키워드가 얼마나 등장하는지는 알기 어렵습니다.
그래서 이 시스템은 뉴스 데이터 수집부터 분석, 출력까지 자동화된 구조로 개발되었습니다.

⚙️ 전체 구조 개요
- 뉴스 RSS 수집: 조선일보, 한겨레, 매일경제 등 국내 주요 언론사의 RSS에서 뉴스 제목을 가져옵니다.
- 형태소 분석: Python의 KoNLPy를 활용해 뉴스 제목에서
명사를 추출합니다. - 정규화 및 불용어 제거: “기자”, “보도”, “오늘” 등 의미 없는 단어를 제거합니다.
- 뉴스 키워드 추출: 등장 빈도를 기준으로 상위 10개의 키워드를 선정합니다.
- 시간별 저장: 분석 결과는 매시간 별도 저장되어 뉴스 키워드의 흐름을 추적할 수 있습니다.
- 워드프레스 표시: 숏코드를 통해 실시간으로 워드프레스 페이지에 출력됩니다.
📈 어떤 정보를 제공하나요?
- 뉴스 키워드 TOP10: 현재 시간 기준으로 가장 자주 등장한 키워드
- 시간대별 키워드 변화: 매시간 기록된 데이터를 기반으로 키워드의 변화 흐름을 표로 확인
- 관련 뉴스 일부: 키워드가 포함된 대표 뉴스 제목 일부도 함께 제공
⏰ 실시간인가요?
이 시스템은 실시간은 아니며, 매시간 주기적으로 자동 실행되는 구조입니다.
Python 스크립트가 매 정각에 뉴스 RSS를 수집하고 분석 결과를 저장한 뒤, 워드프레스 페이지에서 자동 표시됩니다.
🔗 지금 운영 중인 페이지
📌 향후 계획
- 분야별 키워드 분리: 정치·경제·사회·연예 등 섹션별 뉴스 키워드 정리
- 키워드별 뉴스 요약: GPT를 활용한 자동 요약 기능
- 변화량 표시 및 시각화: 키워드 순위의 상승/하락, 추이 차트 등 시각 요소 강화
- RSS 연결 뉴스 링크 제공: 키워드 관련 기사 클릭 가능하도록 확장
💬 마무리
매시간 뉴스 데이터를 자동으로 분석해주는 이 시스템은, 뉴스 트렌드 분석이 필요한 블로거나 마케팅 담당자, 데이터 분석 입문자에게도 유용한 도구가 될 수 있습니다.
앞으로 기능이 확장되면 정책 분석, 여론 흐름 추적, 키워드 기반 콘텐츠 기획 등 다양한 영역에 활용될 수 있습니다.
※ 본 시스템은 매시간 자동으로 작동되며, 일부 언론사의 RSS 서버 상태에 따라 뉴스 수집이 지연되거나 누락될 수 있습니다.
댓글 남기기