미국의 오픈AI가 인공지능(AI) 챗GPT의 기능을 업데이트하면서 쇼핑 기능을 추가했다고 28일 밝혔다. 이용자가 챗GPT의 ‘검색’ 기능을 눌러 활성화한 뒤 특정 제품을 검색하면, 제품의 특성과 가격을 일목요연하게 정리한 정보뿐 아니라, 소비자 평가를 담은 별점까지 알려준다.
🔎 AI MONitoring
생성형 AI도 성적표를 받는다? LLM 성능을 결정하는 평가 지표 알아보기 📑
최근 LLM(대형 언어 모델)의 수요가 급증하면서, ‘언어 모델의 성능을 어떻게 평가하고 비교하는가’에 대한 관심 또한 함께 높아지고 있습니다.
LLM 성능 평가 지표는?
✅ 모델 간 비교 기준 제공: 다양한 모델 중에서 사용자가 어떤 것을 선택할지 판단하는 데 도움을 줍니다.
✅ 모델 개선 방향 제시: 어떤 부분에서 부족한지 수치로 확인하고, 이를 기반으로 튜닝하거나 개선할 수 있습니다.
✅ 책임 있는 AI 개발의 기반: AI가 잘못된 정보를 생성하거나 편향된 응답을 하지 않도록 관리하는 데도 중요합니다.