문자열 추출
이진 또는 혼합 데이터에서 인쇄 가능한 ASCII 문자열을 추출합니다.
Strings Extraction 정보
Strings Extraction은 Unix "strings" 명령줄 유틸리티와 유사하게 바이너리 또는 혼합 데이터에서 인쇄 가능한 ASCII 문자의 연속된 시퀀스를 스캔하고, 설정 가능한 최소 길이 이상의 모든 읽기 가능한 텍스트 조각을 추출합니다. 이 기능은 바이너리 분석, 맬웨어 연구 및 디지털 포렌식에서 바이너리를 분해하거나 디컴파일하지 않고도 포함된 URL, 파일 경로, 오류 메시지, 함수 이름 및 구성 문자열을 발견하는 데 광범위하게 사용됩니다. 이 도구는 16진수 인코딩, Base64 또는 원본 붙여넣기 형식의 입력을 수락하며, 정확한 위치 참조를 위해 입력 데이터 내의 바이트 오프셋과 함께 추출된 각 문자열을 보고합니다.
사용 방법
16진수 또는 Base64로 인코딩된 바이너리 데이터를 입력 영역에 붙여넣은 다음, 노이즈를 필터링하기 위해 일반적으로 4~8자인 최소 인쇄 가능 문자열 길이 임계값을 설정하십시오. Extract를 클릭하여 데이터를 스캔하고 길이 임계값을 충족하는 모든 인쇄 가능한 ASCII 시퀀스를 나열합니다. 각 결과에는 추출된 문자열과 바이너리 데이터에서의 시작 오프셋이 표시됩니다. 키워드로 결과를 필터링하여 URL, 호스트 이름 또는 오류 메시지와 같은 특정 문자열을 빠르게 찾으십시오. 문서화 또는 추가 분석을 위해 전체 추출 목록을 복사하십시오.
주요 사용 사례
- 컴파일된 바이너리 실행 파일 또는 펌웨어 이미지에서 포함된 URL, API 엔드포인트 및 하드코딩된 자격 증명 추출
- 디버깅을 위해 바이너리 라이브러리 파일(DLL, SO, dylib) 내부에서 읽기 가능한 오류 메시지, 버전 문자열 및 파일 경로 찾기
- 명령 및 제어 서버 호스트 이름, 레지스트리 키 및 동작 지표에 대해 맬웨어 또는 의심스러운 바이너리 샘플 분석
- 데이터 복구 작업 중 부분적으로 손상된 바이너리 파일 또는 디스크 섹터에서 읽을 수 있는 텍스트 조각 복구
- 네트워크 트래픽에서 캡처된 바이너리 프로토콜 페이로드에서 사람이 읽을 수 있는 식별자, 버전 필드 및 매직 문자열 검사