1.
최근에, 그러니까 qwen3.6 35b a3b 모델의 출시 후에 바삐 지냈습니다. 로컬에 세팅하고, 에이전트도 세팅하고, 실제로 생활하면서 기존에 사용하던 gpt대신 로컬에 세팅한 hermes 에이전트를 사용한거죠.
그러다보니 같은 주제로 한번 더 글을 쓰게 될거 같다는 느낌이 들더랍니다.
---
2.
에이전트와 도구 사용, 그리고 충분한 수준의 작업 능력과 지능. 불과 얼마 전까지만 해도, 데이터 주권을 지키면서 이런 수준의 인공지능 비서를 직접 굴리려면 비용이 너무 컸어요.
적어도 “에이전트 구실”을 하는 시스템을 만들려면, 몇천만 원은 각오해야 그럭저럭 쓸 만한 조합이 나왔죠. 모델을 클라우드로 돌리려고 해도 비쌌고, 로컬에서 구동하려고 해도 만만치않게 비쌌죠.
그런데 최근 Qwen 3.6 계열이 나오면서 판도가 크게 바뀌었습니다. 중고 RTX 3090 한 장, 약 150만 원 선의 장비로도 100 TPS 이상의 쾌적한 체감을 기대할 수 있게 됐어요.
“돌아간다”를 넘어서, 실제로 “일을 시킬수 있다"는 수준.
그래서요? 라고 반문할 수 있겠습니다. 어차피 클라우드 모델이 더 저렴하고 빠른거아닌가요? 라고 생각할수도 있어요. 하지만 돈보다도 개인의 프라이버시가 더 중요한 지점들이 등장한다면...?
전세대 플래그십 모델의 성능을 사용하면서
내 문서와 메모가 외부 서버로 나가지 않고, 작업 기록과 프롬프트가 내 통제 아래 완전하게 남고, 도구 사용, 파일 처리, 검색, 요약 같은 에이전트 작업이나 개인적인 의료 정보등도 완전히 사적으로 운영할 수 있다는거죠.
이건 단순한 로컬 모델의 성능 향상만이 아니에요. 인공지능의 가정보급시대가 본격적으로 열렸다는 신호죠.
그리고 중요한 건, 대부분의 실사용은 “최고급”이 아니라 충분히 쓸만한 수준이면 충분하다는 것. 그 지점이 이제는 개인이 좀 돈을 쓰면 가능한 범위가 되었다는게 중요해요
비싸야 500만 원 정도면, 완전한 프라이버시를 보장받는 로컬 에이전트를 굴릴 수 있는 시대.
우리는 아마도 AI를 처음으로 “빌리는 시대”에서 “집 안에 들이는 시대”로 건너가고 있는 중인거 같아요. |