학술 논문 PDF 번역 시스템
글 8개
기술블로그오픈소스 PDF 번역 도구 BabelDOC에 Rosetta와 GLM 모델을 editable install로 끼워넣은 과정. fork 없이 Strategy 패턴으로 커스텀 Translator를 구현하고 삽질한 기록.
기술블로그PDF 논문 번역에 40분이나 걸리던 파이프라인을 동시성 튜닝, temperature 기반 재시도, 캐시 전략으로 개선한 과정. vLLM continuous batching을 활용한 QPS 16배 증가와 temperature escalation 재시도 패턴을 다룬다.
기술블로그같은 논문에서 attention mechanism이 세 가지로 번역되는 문제를 겪었다. 모델을 파인튜닝하는 대신 glossary injection 방식으로 해결한 과정을 정리했다.
기술블로그멀티 에이전트 시스템에서 서브에이전트가 동시에 같은 파일을 수정하면 데이터가 날아간다. 에이전트 역할 분리와 Scatter-Gather 패턴으로 glossary 워크플로우를 리팩토링한 과정.
기술블로그논문 번역할 때마다 터미널 열어서 명령어 치기 귀찮아서 만들었다. Zotero에서 PDF 우클릭 한 번이면 FastAPI 서버가 Claude를 headless로 돌려 번역 결과를 돌려준다.
기술블로그논문 번역이 수십 분 걸리는데 진행 상황을 알 수 없고, GPU 서버도 매번 수동으로 켜야 했다. Claude의 stream-json 출력을 실시간 파싱하고 JupyterLab WebSocket으로 원격 GPU 서버를 자동 관리하는 과정을 정리했다.
기술블로그nvidia-smi의 메모리 사용량만으로 GPU 상태를 판단하다가 vLLM을 중복 시작하는 사고가 터졌다. GPU API를 만들어 프로세스 레벨까지 보는 상태 머신으로 리팩토링한 과정을 정리했다.
기술블로그순차 실행되던 용어 추출과 레이아웃 분석을 asyncio.gather()로 병렬화하고, Claude Code headless 모드의 stream-json 파싱 깨짐을 수정한 과정.