제 5장: 정렬과 검색(8)

62. 정렬된 데이터 안에서 고속 검색하는 이진 검색(바이너리 서치)

문자열 안의 문자열을 검색하는 알고리즘에는 여러개의 문자로 이루어진 문자열을 대상으로 검색한다는 특징이 있다.
문자열 STR안에 부분 문자열 SUB가 존재하는 위치를 구하는 알고리즘(I에 부분문자열이 발견된 위치가 저장)
1단계: 문자열 비교 시작 위치를 저장하는 변수 I를 0으로 초기화.
2단계: ‘(I+SUB의 문자 길이) < STR의 문자열 길이’라면, 3~6단계를 반복한다.
3단계: 부분 문자열의 위치를 저장하는 변수 J를 0으로 초기화
4단계: J보다 SUB 문자열 길이가 길다면 4단계 반복
5단계
- STR[I] ≠ SUB[J]일 경우 → 반복처리 종료
- STR[I] = SUB[J]일 경우 → I와 J에 각각 1씩 더함
6단계
- J와 SUB의 문자열 길이 동일 → I에 (I-J)를 저장하고 종료(I에 부분문자열 SUB가 발견된 위치가 저장)
- J보다 SUB의 문자열 길이가 길다면 → I에 (I-J+1)를 저장
7단계: I에 -1(발견되지 않음)을 저장