[Langchain] PDF 요약 Agent

2024. 11. 25. 23:06·IT/Langchain
반응형

[Langchain] PDF 요약 Agent

Code

import os

from langchain_community.document_loaders import PDFMinerLoader
from langchain_core.output_parsers import StrOutputParser
from langchain_core.prompts import ChatPromptTemplate
from langchain_ollama import ChatOllama

pdf_filepath = os.path.join("../../../data", "SK_ESG_2023.pdf")
loader = PDFMinerLoader(pdf_filepath)
docs = loader.load()

template = """
# Instruction
이 PDF 문서의 전체 내용을 A4 한 장 분량으로 요약해 주세요. 다음 지침을 따라 요약해 주세요:
1. A4 한 장(약 500-600 단어) 분량으로 작성해 주세요.
2. 요약의 구조: 
   - 도입: 문서의 목적과 주요 주제를 간략히 설명해 주세요.
   - 주요 내용: 문서의 각 주요 섹션을 포함해 중요한 세부 사항과 논점을 정리해 주세요.
   - 결론 및 요점: 문서의 결론과 주요 결과를 요약하고, 주요 포인트를 정리해 주세요.
3. 핵심 내용 강조: 문서에서 가장 중요한 정보, 데이터, 또는 논쟁점을 명확히 제시해 주세요.
4. 어조 및 스타일: 전문적이고 객관적인 어조로 작성해 주세요.
5. 목적: 이 요약은 문서의 전체 내용을 빠르고 정확하게 파악할 수 있도록 하기 위해 사용될 것입니다.

# PDF Document
{pdf_content}
"""
prompt = ChatPromptTemplate.from_template(template)

llm = ChatOllama(
    model="benedict/linkbricks-llama3.1-korean:8b",
    temparature=0,
)
chain = prompt | llm | StrOutputParser()

for token in chain.stream({"pdf_content": "\n".join([doc.page_content for doc in docs])}):
    print(token, end="", flush=True)

Output

SK는 글로벌 생산거점 및 투자 파이프라인을 확대하여 기후위기를 해결하기 위해 도전자의 자세로 이해관계자와 견고한 협력을 선도할 것을 약속한다. SK의 ESG(환경, 사회, 거버넌스) 전략은 'Zero Carbon Lifestyle', 'Sustainable Food', 'Future Energy' 등 4가지 주제에 초점을 맞춰 구성된다.

1. **Waste to Resources**: 폐배터리 및 플라스틱 재활용 사업 등 폐기물 배출-운송-처리 생애주기의 디지털 기반 추적/관리 솔루션 개발과 폐배터리 리사이클링 사업을 진행한다.
2. **Sustainable Food**: 발효 유 및 미생물 기술을 통한 단백질 생산과 식물성 대체육 및 세포배양 연어육 생산 등 발효 기술을 활용하는 사업에 투자한다.
3. **CLEAN MOBILITY**: 모빌리티용 수소 연료전지 기술, EV 충전 사업, SiC 전력반도체 기반 EV/ESS 적용 등 에너지솔루션 사업에 참여한다.
4. **Green Digital Solution**: 친환경 혁신 소재 Smart Glass를 통한 디지털 솔루션 개발과 4세대 고성능 D램 및 고효율 건물용 에너지 효율 개선 기술, 기업용 SSD 개발 등 전반적인 디지털 사업에 기여한다.
5. **Zero Carbon Lifestyle**: 글로벌 탄소감축 기여 2억톤 달성을 목표로 한탄소 포집 및 활용, 저장기술(CCUS) 등 개발을 추진한다.

이러한 ESG 전략을 통해 SK는 지속가능한 발전의 길에 동참하며 기업의 사회적 책임(CSR)을 강화하는 데 주력하고 있다.

PDF File

https://github.com/sanggi-wjg/ai-demos/blob/main/langchain_demos/data/SK_ESG_2023.pdf

 

ai-demos/langchain_demos/data/SK_ESG_2023.pdf at main · sanggi-wjg/ai-demos

Contribute to sanggi-wjg/ai-demos development by creating an account on GitHub.

github.com

 

 
728x90
반응형
저작자표시 비영리 (새창열림)
'IT/Langchain' 카테고리의 다른 글
  • [Langchain] AI vs AI 토론을 가장한 말싸움 하기
  • [Langchain] 웹 요약 Agent
  • [Langchain] Math Agent
  • [Langchain] 네이버 뉴스 요약
상쾌한기분
상쾌한기분
  • 상쾌한기분
    상쾌한기분
    상쾌한기분
  • 전체
    오늘
    어제
    • 분류 전체보기 (251)
      • Python (44)
        • Python (26)
        • Django (6)
        • Flask (4)
        • Open Source (6)
      • Kotlin & Java (5)
        • Spring (2)
        • 프로젝트 (1)
      • Go (11)
      • Database (24)
        • MySQL (21)
        • Redis (3)
      • Infrastructure (2)
        • CDC (4)
        • Kafka (5)
        • Prometheus (2)
        • Fluentd (11)
        • Docker (1)
        • Airflow (2)
        • VPN (2)
      • IT (26)
        • AI (9)
        • Langchain (8)
        • Web (18)
        • Git (8)
        • 리팩토링 (9)
        • Micro Service Architecture (8)
        • Clean Code (16)
        • Design Pattern (0)
        • 수학 (1)
        • 알고리즘 (14)
      • OS (14)
        • Centos (10)
        • Ubuntu (3)
        • Mac (1)
      • Search Engine (2)
        • ElasticSearch (1)
        • Lucene Solr (1)
      • PHP (2)
        • Laravel (1)
        • Codeigniter (1)
  • 블로그 메뉴

    • Github 방문
  • 링크

  • 공지사항

  • 인기 글

  • 태그

    http
    fluentd
    prompt
    LLM
    Golang
    python
    파이썬
    티스토리챌린지
    오블완
    CDC
    MYSQL
    ollama
    docker
    Langchain
    Redis
    performance
    Kafka
    go
    백준
    git
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.3
상쾌한기분
[Langchain] PDF 요약 Agent
상단으로

티스토리툴바