Java (Jsoup)로 초간단 웹 스크래핑

발행: (2026년 2월 16일 오전 09:51 GMT+9)
2 분 소요
원문: Dev.to

Source: Dev.to

Jsoup 추가

<dependency>
    <groupId>org.jsoup</groupId>
    <artifactId>jsoup</artifactId>
    <version>1.17.2</version>
</dependency>

최소한의 스크래퍼 만들기

이 예제에서는 페이지의 모든 링크(텍스트와 URL)를 출력합니다:

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;

public class SimpleScraper {
    public static void main(String[] args) throws Exception {
        String url = "https://example.com"; // 여기 값을 변경하세요

        Document doc = Jsoup.connect(url).get();

        for (Element link : doc.select("a[href]")) {
            System.out.println(link.text() + " -> " + link.absUrl("href"));
        }
    }
}

그게 전부입니다! 모델도 없고, JSON도 없으며, 추가 라이브러리도 필요 없습니다.

추가 팁

특정한 것을 원한다면 선택자를 바꾸면 됩니다. 예시:

  • 기사 제목: h1, h2, h3
  • 제품 카드: .product
  • 가격: .price
  • ID로 요소 선택: #price

예시: 모든 h2 제목을 출력하기:

for (Element h : doc.select("h2")) {
    System.out.println(h.text());
}

행복한 코딩 되세요!

0 조회
Back to Blog

관련 글

더 보기 »