문제 설명
카카오에 입사한 신입 개발자 네오는 "카카오계정개발팀"에 배치되어, 카카오 서비스에 가입하는 유저들의 아이디를 생성하는 업무를 담당하게 되었습니다. "네오"에게 주어진 첫 업무는 새로 가입하는 유저들이 카카오 아이디 규칙에 맞지 않는 아이디를 입력했을 때, 입력된 아이디와 유사하면서 규칙에 맞는 아이디를 추천해주는 프로그램을 개발하는 것입니다.
다음은 카카오 아이디의 규칙입니다.
- 아이디의 길이는 3자 이상 15자 이하여야 합니다.
- 아이디는 알파벳 소문자, 숫자, 빼기(-), 밑줄(_), 마침표(.) 문자만 사용할 수 있습니다.
- 단, 마침표(.)는 처음과 끝에 사용할 수 없으며 또한 연속으로 사용할 수 없습니다.
"네오"는 다음과 같이 7단계의 순차적인 처리 과정을 통해 신규 유저가 입력한 아이디가 카카오 아이디 규칙에 맞는 지 검사하고 규칙에 맞지 않은 경우 규칙에 맞는 새로운 아이디를 추천해 주려고 합니다.
신규 유저가 입력한 아이디가 new_id 라고 한다면,
1단계 new_id의 모든 대문자를 대응되는 소문자로 치환합니다.
2단계 new_id에서 알파벳 소문자, 숫자, 빼기(-), 밑줄(_), 마침표(.)를 제외한 모든 문자를 제거합니다.
3단계 new_id에서 마침표(.)가 2번 이상 연속된 부분을 하나의 마침표(.)로 치환합니다.
4단계 new_id에서 마침표(.)가 처음이나 끝에 위치한다면 제거합니다.
5단계 new_id가 빈 문자열이라면, new_id에 "a"를 대입합니다.
6단계 new_id의 길이가 16자 이상이면, new_id의 첫 15개의 문자를 제외한 나머지 문자들을 모두 제거합니다.
만약 제거 후 마침표(.)가 new_id의 끝에 위치한다면 끝에 위치한 마침표(.) 문자를 제거합니다.
7단계 new_id의 길이가 2자 이하라면, new_id의 마지막 문자를 new_id의 길이가 3이 될 때까지 반복해서 끝에 붙입니다.
예를 들어, new_id 값이 "...!@BaT#*..y.abcdefghijklm" 라면, 위 7단계를 거치고 나면 new_id는 아래와 같이 변경됩니다.
1단계 대문자 'B'와 'T'가 소문자 'b'와 't'로 바뀌었습니다.
"...!@BaT#*..y.abcdefghijklm" → "...!@bat#*..y.abcdefghijklm"
2단계 '!', '@', '#', '*' 문자가 제거되었습니다.
"...!@bat#*..y.abcdefghijklm" → "...bat..y.abcdefghijklm"
3단계 '...'와 '..' 가 '.'로 바뀌었습니다.
"...bat..y.abcdefghijklm" → ".bat.y.abcdefghijklm"
4단계 아이디의 처음에 위치한 '.'가 제거되었습니다.
".bat.y.abcdefghijklm" → "bat.y.abcdefghijklm"
5단계 아이디가 빈 문자열이 아니므로 변화가 없습니다.
"bat.y.abcdefghijklm" → "bat.y.abcdefghijklm"
6단계 아이디의 길이가 16자 이상이므로, 처음 15자를 제외한 나머지 문자들이 제거되었습니다.
"bat.y.abcdefghijklm" → "bat.y.abcdefghi"
7단계 아이디의 길이가 2자 이하가 아니므로 변화가 없습니다.
"bat.y.abcdefghi" → "bat.y.abcdefghi"
따라서 신규 유저가 입력한 new_id가 "...!@BaT#*..y.abcdefghijklm"일 때, 네오의 프로그램이 추천하는 새로운 아이디는 "bat.y.abcdefghi" 입니다.
[문제]
신규 유저가 입력한 아이디를 나타내는 new_id가 매개변수로 주어질 때, "네오"가 설계한 7단계의 처리 과정을 거친 후의 추천 아이디를 return 하도록 solution 함수를 완성해 주세요.
[제한사항]
new_id는 길이 1 이상 1,000 이하인 문자열입니다.
new_id는 알파벳 대문자, 알파벳 소문자, 숫자, 특수문자로 구성되어 있습니다.
new_id에 나타날 수 있는 특수문자는 -_.~!@#$%^&*()=+[{]}:?,<>/ 로 한정됩니다.
[입출력 예]nonew_idresult
예1 |
"...!@BaT#*..y.abcdefghijklm" |
"bat.y.abcdefghi" |
예2 |
"z-+.^." |
"z--" |
예3 |
"=.=" |
"aaa" |
예4 |
"123_.def" |
"123_.def" |
예5 |
"abcdefghijklmn.p" |
"abcdefghijklmn" |
입출력 예에 대한 설명
입출력 예 #1
문제의 예시와 같습니다.
입출력 예 #2
7단계를 거치는 동안 new_id가 변화하는 과정은 아래와 같습니다.
1단계 변화 없습니다.
2단계 "z-+.^." → "z-.."
3단계 "z-.." → "z-."
4단계 "z-." → "z-"
5단계 변화 없습니다.
6단계 변화 없습니다.
7단계 "z-" → "z--"
입출력 예 #3
7단계를 거치는 동안 new_id가 변화하는 과정은 아래와 같습니다.
1단계 변화 없습니다.
2단계 "=.=" → "."
3단계 변화 없습니다.
4단계 "." → "" (new_id가 빈 문자열이 되었습니다.)
5단계 "" → "a"
6단계 변화 없습니다.
7단계 "a" → "aaa"
입출력 예 #4
1단계에서 7단계까지 거치는 동안 new_id("123_.def")는 변하지 않습니다. 즉, new_id가 처음부터 카카오의 아이디 규칙에 맞습니다.
입출력 예 #5
1단계 변화 없습니다.
2단계 변화 없습니다.
3단계 변화 없습니다.
4단계 변화 없습니다.
5단계 변화 없습니다.
6단계 "abcdefghijklmn.p" → "abcdefghijklmn." → "abcdefghijklmn"
7단계 변화 없습니다.
[ 내가 작성한 코드 ]
import java.util.Locale;
public class 신규아이디추천 {
/*
- 해야할 일
1) 규칙에 맞지 않는 아이디를 입력했을 때, 입력된 아이디와 유사하면서 규칙에 맞는 아이디를 추천
- 아이디 규칙
1) 길이: 3 ~ 15
2) 사용가능 문자 : 소문자, 빼기, 밑줄, 마침표
3) 단, 마침표는 시작과 끝에 사용 불가능, 연속으로 사용 불가능
- 해야할 일의 처리 과정
1단계 new_id의 모든 대문자를 대응되는 소문자로 치환합니다.
2단계 new_id에서 알파벳 소문자, 숫자, 빼기(-), 밑줄(_), 마침표(.)를 제외한 모든 문자를 제거합니다.
3단계 new_id에서 마침표(.)가 2번 이상 연속된 부분을 하나의 마침표(.)로 치환합니다.
4단계 new_id에서 마침표(.)가 처음이나 끝에 위치한다면 제거합니다.
5단계 new_id가 빈 문자열이라면, new_id에 "a"를 대입합니다.
6단계 new_id의 길이가 16자 이상이면, new_id의 첫 15개의 문자를 제외한 나머지 문자들을 모두 제거합니다.
만약 제거 후 마침표(.)가 new_id의 끝에 위치한다면 끝에 위치한 마침표(.) 문자를 제거합니다.
7단계 new_id의 길이가 2자 이하라면, new_id의 마지막 문자를 new_id의 길이가 3이 될 때까지 반복해서 끝에 붙입니다.
능 */
public static void main(String[] args) {
String newId = "00.@cdefgTWhijklm...!_I'," ;
String solution = solution(newId);
System.out.println("res: " + solution);
}
public static String solution(String new_id) {
String answer = "";
String one = "";
String two = "";
String three = "";
String four = "";
String five = "";
String six = "";
String seven = "";
// 1
one = new_id.toLowerCase(Locale.ROOT);
char[] ch = one.toCharArray();
// 2
for (int i = 0; i < ch.length; i++) {
if(('a'<= ch[i] && ch[i] <= 'z') || ('0' <= ch[i] && ch[i] <= '9') ||
(ch[i]=='-') || (ch[i] =='_') || (ch[i] == '.')){
two += ch[i];
} else {
continue;
}
}
// 3
three = two;
while(three.contains("..")){
three = three.replace("..", ".");
}
//4
four = three;
if (four.length() > 0 && four.charAt(0) == '.') {
four = four.substring(1, four.length());
}
if (four.length() > 0 && four.charAt(four.length() - 1) == '.') {
four = four.substring(0, four.length() - 1);
}
//5
five = four;
if (five.isEmpty()) {
five = "a";
}
//6
six = five;
if(six.length() > 15){
six = six.substring(0, 15);
if(six.substring(six.length()-1,six.length()).equals(".")){
six = six.substring(0,six.length()-1);
}
}
//7
seven = six;
while(seven.length()<=2){
ch = seven.toCharArray();
seven += ch[ch.length-1];
}
answer = seven;
return answer;
}
}
저는 위와 같이 1단계부터 7단계까지 각 단계별로 풀이를 하였습니다.
하지만 다른 사람의 풀이를 보니 replaceAll 과 정규표현식의 중요성을 알 수 있었습니다.
replaceAll()
형식
String replaceAll(String regex, String replacement)
대상 문자열을 원하는 문자값으로 변환하는 함수입니다.
- 첫번째 매개변수는 변화하고자 하는 대상이 될 문자열
- 두번째 매개변수는 변환할 문자 값
그렇다면 replace 와 차이점이 무엇일까요??
이는 CharSequence 와 String 의 차이점입니다. CharSequence 에 정규 표현식이 사용 가능한것입니다.
정규 표현식 (정규식)
특정한 규칙을 가진 문자열의 집합을 표현하는데 사용되는 언어입니다.
주로 텍스트 편집기나 스크립트 언어에서 문자열의 검색과 치환을 위해 지원되고 있습니다.
정규표현식 문법은 다음과 같습니다.
^ |
문자열의 시작 |
$ |
문자열의 끝 |
. |
임의의 한 문자 |
* |
문자가 0번 이상 발생 |
+ |
문자가 1번 이상 발생 |
? |
문자가 0번 혹은 1번 발생 |
[ ] |
문자의 집합 범위를 나타냄 [0-9] : 숫자 (0 ~ 9) [a-z] : 알파벳 (a ~ z) 앞에 ^ 가 나타나면 not 임 |
{ } |
횟수 또는 범위를 의미 |
( ) |
소괄호 안의 하나의 문자 |
\w |
알파벳이나 숫자 |
\d |
[0-9] 와 동일 |
\D |
숫자를 제외한 모든 문자 |
자주 사용하는 정규 표현식
^[0-9]*$ |
숫자 |
^[a-zA-Z]*$ |
영문자 |
^[가-힣]*$ |
한글 |
\\w+@\\w+\\.\\w+(\\.\\w+)? |
이메일 주소 |
^\d{2,3}-\d{3,4}-\d{4}$ |
전화번호 |
^01(?:0|1|[6-9])- (?:]\d{3}|\d{4}-\d{4}$ |
핸드폰 번호 |
\d{6} \- [1-4]\d{6} |
주민등록 번호 |
위를 응용한 예시를 살펴보겠습니다.
알파벳의 중복은 허용하고, 띄어쓰기 ( \s ) 는 한칸만 허용
@Pattern(regexp = "^[a-zA-Z]*\\s?[a-zA-Z]*$")
- [ ] * : 해당 알파벳이 0회 이상 반복 ( 있어도 되고, 없어도 됨 )
- \\s? : 공백이 1회 또는 0회만 있어야함
- [ ] * : 공백 뒤에 알파벳 0회 이상 반복을 한번 더 선언해줌으로써 공백 뒤에 알파벳 오는 경우를 대비
** 정규식 확인 페이지
https://www.regexplanet.com/advanced/java/index.html