에이전트 ai 종류

43강. 에이전트 평가·벤치마크

43강. 에이전트 평가·벤치마크43강 / 45
· Lv 12 에이전트 종류 — 멀티·평가·추천 · 43/45강
에이전트 ai 종류 · Lv 12 에이전트 종류 — 멀티·평가·추천강의 43 / 45⏱ 25분

96% 진행 중

📌 한 줄 요약
HELM·AgentBench·SWE-Bench
왜 이걸 배워요?

학원에서는 이 부분 30분 만에 후딱 넘기는 곳이에요. 그래서 처음 시작한 분들이 대부분 여기서 막힙니다. 천천히 풀어보겠습니다.

🏪 편의점 알바라면

처음 카운터 보면 어색하지만, 1주일 지나면 단축키처럼 손이 외웁니다. 코드도 마찬가지 — 글로 외우는 게 아니라 손에 익히는 겁니다.

📋 오늘 손에 익혀갈 것

1SWE-Bench 코딩 평가 1위 지표
2한국어 벤치마크 KoBEST
3실무에서 본인 케이스로 측정

🎯 단계별 학습

STEP 1

SWE-Bench 코딩 평가 1위 지표

SWE-Bench 코딩 평가 1위 지표를 다룰 때 사람들이 두 갈래로 나뉩니다 — “한 번에 다 외우려는 사람”과 “필요할 때 검색하는 사람”. 후자가 결국 빠릅니다. 우리도 후자로 갑시다.

👉 이 한 줄만 정확히 입력해보세요. 오타 한 글자가 1시간을 잡아먹습니다.
STEP 2

한국어 벤치마크 KoBEST

한국어 벤치마크 KoBEST, 이거 왜 이렇게 동작할까요? 답을 외우는 것보다, 한 줄로 설명할 수 있는지 자가 점검하는 게 훨씬 오래 갑니다. 못 하겠으면 ChatGPT한테 “5살에게 설명해줘”라고 물어보세요.

👉 두 번 반복해보세요. 첫 번째는 따라치는 것, 두 번째는 손이 외우는 것.
STEP 3

실무에서 본인 케이스로 측정

실무에서 본인 케이스로 측정를 처음 만났을 때 “어렵다”가 아니라 “어색하다”가 더 정확한 표현이에요. 두 번째 만나면 어색함이 사라지고, 다섯 번째에는 손이 먼저 움직입니다.

👉 지금 따라해보세요. 30초 안에 손이 움직여야 합니다.

⚠️ 흔한 실수 — 미리 알고 갑시다

🚨 검증 없이 다음으로 넘어가지 말 것
한 단계 결과가 화면에 안 떠 있는데 다음 단계로 가면, 5강 뒤에 누적 오류가 폭발합니다. 항상 결과를 눈으로 확인하고 가세요.
🔄 내일 다시 보기
오늘 끝낸 강의는 내일 한 번 더 훑으세요. 30초만 봐도 누적 효과가 큽니다.
📌 실제 사례
강수정 시니어 (62세)

Lv 1 "전원 버튼"부터 시작하셨어요. 8개월 후 손주 생일 카드를 직접 만들어 보내신 사진을 운영자한테 보내주셨습니다.

1년 후 본인=오늘 30분이 365번 누적된 결과

📝 셀프 체크 — 다음 강의로 가도 되는지 확인

아래 질문에 1분 안에 답할 수 있다면 통과. 못 답하면 이 강의 한 번만 더 빠르게 훑어보세요.

  1. SWE-Bench 코딩 평가 1위 지표→ 5살에게 설명한다면 어떻게?
  2. 한국어 벤치마크 KoBEST→ 5살에게 설명한다면 어떻게?
  3. 실무에서 본인 케이스로 측정→ 5살에게 설명한다면 어떻게?

강의 완료 누르면 +10 XP. 누적 XP에 따라 코인이 쌓이고, 그 코인으로 잠긴 강의를 해제합니다.

완료 시 진행도 자동 저장 · 코인은 강의 잠금 해제에 사용