비용과 로컬 모델 팁
아는 사람이 M4 24G에 gpt-oss 20b q5를 돌리고있습니다. 옆에서 보니까 충분히 똑똑하다고하네요. 이게 신박한게, 자기가 하기에 벅찬 일이 떨어지면 codex cli를 이용한다고합니다. codex는 추가로 토큰 소모를 안하니까 엄청 경제적이죠.
아무리 저렴이 2.5 flash를 써도 하루 10달러는 우습게 나갑니다. 한달이면 30만원, 두달이면 60만원. 그래서 저도 맥미니 24g로 구매했네요.
오픈클로가 한번 실행할때 컨텍스트 크기가 10k가 넘는다고합니다 - 토큰 소모의 주범이지만, 동시에 그래서 우와 하는 체감을 주는지도 모르겠습니다. 오픈모델을 사용할때는 꼭 컨텍스트 제한을 늘려줘야 한답니다.


