어휘 구조 (Lexical Structure)
구문의 최하위 수준의 컴포넌트를 사용합니다.
Swift 의 어휘 구조 (lexical structure) 는 언어의 유효한 토큰을 형성하는 문자 시퀀스를 설명합니다. 이러한 유효한 토큰은 언어의 최하위 구성 요소를 형성하며 이후 챕터에서 나머지 언어를 설명하는데 사용됩니다. 토큰은 식별자 (identifier), 키워드 (keyword), 구두점 (punctuation), 리터럴 (literal), 또는 연산자 (operator) 로 구성됩니다.
대부분의 경우 토큰은 아래에 지정된 문법의 제약 조건 내에서 입력 텍스트에서 가능한 가장 긴 부분 문자열을 고려하여 Swift 소스 파일의 문자에서 생성됩니다. 이 동작을 최장 일치 (longest match) 또는 최대 뭉크 (maximal munch) 라고 합니다.
공백과 주석 (Whitespace and Comments)
공백에는 두가지 용도가 있습니다: 소스 파일에서 토큰을 분리하고 접두사, 접미사, 그리고 중위 연산자(연산자 (Operators) 참조)를 구분 하는데 사용하지만 그렇지 않으면 무시됩니다. 다음 문자는 공백으로 간주합니다: 공백 (U+0020), 줄바꿈 (U+000A), 캐리지 리턴 (U+000D), 수평탭 (U+0009), 수직 (U+000B), 폼피드(U+000C) 그리고 null (U+0000).
주석은 컴파일러에 의해 공백으로 처리됩니다. 한 줄 주석은 //
로 시작하고 줄바꿈 (U+000A) 또는 캐리지 리턴 (U+000D) 까지 계속됩니다. 여러줄 주석은 /*
로 시작하고 */
으로 끝납니다. 여러줄 주석을 중첩할 수 있지만 주석 마커는 균형을 이루어야 합니다.
주석은 마크업 서식 참조 (Markup Formatting Reference) 에 설명된 대로 추가 서식 및 마크업을 포함할 수 있습니다.
Grammar of whitespace:
whitespace → whitespace-item whitespace? whitespace-item → line-break whitespace-item → inline-space whitespace-item → comment whitespace-item → multiline-comment whitespace-item → U+0000, U+000B, or U+000C
line-break → U+000A line-break → U+000D line-break → U+000D followed by U+000A
inline-spaces → inline-space inline-spaces? inline-space → U+0009 or U+0020
comment →
//
comment-text line-break multiline-comment →/*
multiline-comment-text*/
comment-text → comment-text-item comment-text? comment-text-item → Any Unicode scalar value except U+000A or U+000D
multiline-comment-text → multiline-comment-text-item multiline-comment-text? multiline-comment-text-item → multiline-comment multiline-comment-text-item → comment-text-item multiline-comment-text-item → Any Unicode scalar value except
/*
or*/
식별자 (Identifiers)
식별자 (Identifiers) 는 A 부터 Z 까지 대문자 또는 소문자, 언더바 (_
), 다국어 기본 평면 (Basic Multilingual Plane) 에 조합하지 않은 영숫자 유니코드 문자 (noncombining alphanumeric Unicode character), 또는 개인 사용 영역 (Private Use Area) 에 없는 다국어 기본 평면 외부의 문자로 시작합니다. 첫번째 문자 다음에 숫자와 유니코드 조합 문자 (combining Unicode characters) 도 허용됩니다.
선언에 public
접근-수준 수정자가 있더라도 언더바로 시작하는 식별자, 첫번째 인수 라벨이 언더바로 시작하는 서브 스크립트, 그리고 첫번째 인수 라벨이 언더바로 시작하는 초기화 구문은 internal
식별자로 처리합니다. 이 규칙을 통해 프레임워크 작성자는 일부 제한사항에 따라 선언이 공개되어야 하는 경우에도 클라이언트와 상호 작용하거나 의존해서는 안되는 API 의 부분을 표시할 수 있습니다. 또한 두 개의 언더바로 시작하는 식별자는 Swift 컴파일러와 표준 라이브러리 용으로 사용됩니다.
예약어 (reserved word) 를 식별자로 사용하려면 앞뒤에 백틱 (`) 을 넣어야 합니다. 예를 들어 class
는 유효한 식별자가 아니지만 class
는 유효합니다. 백틱은 식별자의 부분으로 간주되지 않습니다: `x
` 와 x
는 같은 의미입니다.
명시적으로 파라미터 이름이 없는 클로저 내의 파라미터는 암시적으로 $0
, $1
, $2
, 등으로 지정됩니다. 이 이름은 클로저의 범위 내에서 유효한 식별자입니다.
컴파일러는 프로퍼티 래퍼 프로젝션 (property wrapper projection)이 있는 프로퍼티에 달러 기호 ($
)로 시작하는 식별자를 합성합니다. 코드는 이 식별자와 상호작용 할 수 있지만 이 접두사로 식별자를 선언할 수 없습니다. 더 자세한 내용은 속성 (Attributes) 챕터에 프로퍼티 래퍼 (propertyWrapper) 를 참고 바랍니다.
Grammar of an identifier:
identifier → identifier-head identifier-characters? identifier →
`
identifier-head identifier-characters?`
identifier → implicit-parameter-name identifier → property-wrapper-projection identifier-list → identifier | identifier,
identifier-listidentifier-head → Upper- or lowercase letter A through Z identifier-head →
_
identifier-head → U+00A8, U+00AA, U+00AD, U+00AF, U+00B2–U+00B5, or U+00B7–U+00BA identifier-head → U+00BC–U+00BE, U+00C0–U+00D6, U+00D8–U+00F6, or U+00F8–U+00FF identifier-head → U+0100–U+02FF, U+0370–U+167F, U+1681–U+180D, or U+180F–U+1DBF identifier-head → U+1E00–U+1FFF identifier-head → U+200B–U+200D, U+202A–U+202E, U+203F–U+2040, U+2054, or U+2060–U+206F identifier-head → U+2070–U+20CF, U+2100–U+218F, U+2460–U+24FF, or U+2776–U+2793 identifier-head → U+2C00–U+2DFF or U+2E80–U+2FFF identifier-head → U+3004–U+3007, U+3021–U+302F, U+3031–U+303F, or U+3040–U+D7FF identifier-head → U+F900–U+FD3D, U+FD40–U+FDCF, U+FDF0–U+FE1F, or U+FE30–U+FE44 identifier-head → U+FE47–U+FFFD identifier-head → U+10000–U+1FFFD, U+20000–U+2FFFD, U+30000–U+3FFFD, or U+40000–U+4FFFD identifier-head → U+50000–U+5FFFD, U+60000–U+6FFFD, U+70000–U+7FFFD, or U+80000–U+8FFFD identifier-head → U+90000–U+9FFFD, U+A0000–U+AFFFD, U+B0000–U+BFFFD, or U+C0000–U+CFFFD identifier-head → U+D0000–U+DFFFD or U+E0000–U+EFFFDidentifier-character → Digit 0 through 9 identifier-character → U+0300–U+036F, U+1DC0–U+1DFF, U+20D0–U+20FF, or U+FE20–U+FE2F identifier-character → identifier-head identifier-characters → identifier-character identifier-characters?
implicit-parameter-name →
$
decimal-digits property-wrapper-projection →$
identifier-characters
키워드와 구두점 (Keywords and Punctuation)
다음의 키워드는 예약되어 있으므로 식별자 (Identifiers) 에서 설명된대로 백틱을 사용하지 않는한 식별자로 사용될 수 없습니다. inout
, var
, 그리고 let
이외의 키워드는 백틱을 사용하지 않고도 함수 선언 또는 함수 호출에서 파라미터 이름으로 사용될 수 있습니다. 멤버가 키워드와 이름이 같은 경우 해당 멤버에 대한 참조는 멤버 참조와 키워드 사용 사이에 모호성이 있는 경우를 제외하고는 백틱을 사용할 필요가 없습니다 — 예를 들어 self
, Type
, 그리고 Protocol
은 명시적 멤버 표현식에서 특별한 의미가 있으므로 해당 컨텍스트에서 백틱을 사용해야 합니다.
선언에 사용되는 키워드:
associatedtype
,borrowing
,class
,consuming
,deinit
,enum
,extension
,fileprivate
,func
,import
,init
,inout
,internal
,let
,nonisolated
,open
,operator
,precedencegroup
,private
,protocol
,public
,rethrows
,static
,struct
,subscript
,typealias
, 그리고var
.구문에 사용되는 키워드:
break
,case
,catch
,continue
,default
,defer
,do
,else
,fallthrough
,for
,guard
,if
,in
,repeat
,return
,switch
,throw
,where
, 그리고while
.표현식과 타입에 사용되는 키워드:
Any
,as
,await
,catch
,false
,is
,nil
,rethrows
,self
,Self
,super
,throw
,throws
,true
, 그리고try
.패턴에 사용되는 키워드:
_
.숫자 기호 (
#
) 로 시작하는 키워드:#available
,#colorLiteral
,#else
,#elseif
,#endif
,#fileLiteral
,#if
,#imageLiteral
,#keyPath
,#selector
,#sourceLocation
,#unavailable
.
Note: Swift 5.9 이전에는 다음의 키워드는 예약되어 있습니다:
#column
,#dsohandle
,#error
,#fileID
,#filePath
,#file
,#function
,#line
, 그리고#warning
. 이것은 현재 Swift 표준 라이브러리에 매크로로 구현되어 있습니다:column
,dsohandle
,error(_:)
,fileID
,filePath
,file
,function
,line
, 그리고warning(_:)
.
특정 컨텍스트에서 예약된 키워드:
associativity
,async
,convenience
,didSet
,dynamic
,final
,get
,indirect
,infix
,lazy
,left
,mutating
,none
,nonmutating
,optional
,override
,postfix
,precedence
,prefix
,Protocol
,required
,right
,set
,some
,Type
,unowned
,weak
, 그리고willSet
. 컨텍스트 외부에서는 식별자로 사용될 수 있습니다.
다음 토큰은 구두점으로 예약되어 있으므로 연산자로 사용될 수 없습니다: (
, )
, {
, }
, [
, ]
, .
, ,
, :
, ;
, =
, @
, #
, &
(접두사 연산자로), ->
, `````, ?
, 그리고 !
(접미사 연산자로).
리터럴 (Literals)
리터럴 (literal) 은 숫자 또는 문자열과 같은 타입 값의 소스코드 표현입니다.
다음은 리터럴의 예제입니다:
리터럴은 자체 타입이 없습니다. 대신에 리터럴은 무한 정밀도를 가진 구문으로 분석되고 Swift 의 타입 추론은 리터럴에 대한 타입을 추론하려고 합니다. 예를 들어 let x: Int8 = 42
선언에서 Swift 는 명시적 타입 설명 (: Int8
) 을 사용하여 정수 리터럴 42
가 Int8
의 타입이라고 추론합니다. 사용 가능한 적절한 타입 정보가 없는 경우 Swift 는 Swift 표준 라이브러리와 아래 표에서 정의된 기본 리터럴 타입 중 하나라고 유추합니다. 리터럴 값에 대한 타입 추론을 지정할 때 추론의 타입은 리터럴 값으로 부터 인스턴스될 수 있어야 합니다. 즉, 타입은 아래 표에 있는 Swift 표준 라이브러리 프로토콜을 준수해야 합니다.
리터럴
기본타입
프로토콜
정수
Int
ExpressibleByIntegerLiteral
부동소수점
Double
ExpressibleByFloatLiteral
문자열
String
단일 유니코드 스칼라만 포함하는 문자열 리터럴의 경우에는 ExpressibleByStringLiteral
, ExpressibleByUnicodeScalarLiteral
단일 확장 자소 클러스터 (single extended grapheme cluster)만 포함하는 문자열 리터럴의 경우에는 ExpressibleByExtendedGraphemeClusterLiteral
정규 표현식
Regex
None
불린
Bool
ExpressibleByBooleanLiteral
예를 들어, let str = "Hello, world"
선언에서 문자열 리터럴 "Hello, world"
의 추론된 타입은 기본적으로 String
입니다. 또한 Int8
은 ExpressibleByIntegerLiteral
프로토콜을 준수하므로 let x: Int8 = 42
선언에서 정수 리터럴 42
에 대해 해당 타입을 사용할 수 있습니다.
Grammar of a literal:
literal → numeric-literal | string-literal | regular-expression-literal | boolean-literal | nil-literal
numeric-literal →
-
? integer-literal |-
? floating-point-literal boolean-literal →true
|false
nil-literal →nil
정수 리터럴 (Integer Literals)
정수 리터럴 (Integer literals) 은 정밀도가 지정되지 않은 정수값을 나타냅니다. 기본적으로 정수 리터럴은 10진법으로 표현되지만 접두사를 사용하여 기준을 지정할 수 있습니다. 2진법 리터럴은 0b
로 시작하고, 8진법 리터럴은 0o
, 그리고 16진법 리터럴은 0x
로 시작합니다.
10진법 리터럴은 0
부터 9
까지의 숫자를 포함합니다. 2진법 리터럴은 0
과 1
을 포함하고 8진법 리터럴은 0
부터 7
을 포함하고, 16진법 리터럴은 0
부터 9
뿐만 아니라 A
부터 F
까지의 대문자 또는 소문자를 포함합니다.
음의 정수 리터럴은 -42
와 같이 정수 리터럴 앞에 마이너스 기호 (-
) 로 표현됩니다.
가독성을 위해 숫자 사이에 언더바 (_
)를 허용하지만 무시되므로 리터럴 값에 영향을 주지 않습니다. 정수 리터럴은 0
으로 시작할 수 있지만 무시되므로 리터럴 값에 영향을 주지 않습니다.
달리 지정하지 않는 한 정수 리터럴의 기본 유추 타입은 Swift 표준 라이브러리 타입 Int
입니다. Swift 표준 라이브러리는 정수 (Integers) 에서 설명 했듯이 다양한 크기의 부호있는 정수와 부호없는 정수의 타입을 정의합니다.
Grammar of an integer literal:
integer-literal → binary-literal integer-literal → octal-literal integer-literal → decimal-literal integer-literal → hexadecimal-literal
binary-literal →
0b
binary-digit binary-literal-characters? binary-digit → Digit 0 or 1 binary-literal-character → binary-digit |_
binary-literal-characters → binary-literal-character binary-literal-characters?octal-literal →
0o
octal-digit octal-literal-characters? octal-digit → Digit 0 through 7 octal-literal-character → octal-digit |_
octal-literal-characters → octal-literal-character octal-literal-characters?decimal-literal → decimal-digit decimal-literal-characters? decimal-digit → Digit 0 through 9 decimal-digits → decimal-digit decimal-digits? decimal-literal-character → decimal-digit |
_
decimal-literal-characters → decimal-literal-character decimal-literal-characters?hexadecimal-literal →
0x
hexadecimal-digit hexadecimal-literal-characters? hexadecimal-digit → Digit 0 through 9, a through f, or A through F hexadecimal-literal-character → hexadecimal-digit |_
hexadecimal-literal-characters → hexadecimal-literal-character hexadecimal-literal-characters?
부동 소수점 리터럴 (Floating-Point Literals)
부동 소수점 리터럴 (Floating-point literals) 은 정밀도가 지정되지 않은 부동 소수점 값을 나타냅니다.
기본적으로 부동 소수점 리터럴은 접두사 없이 10진법으로 표현되지만 0x
접두사를 붙여 16진법으로 표현될 수도 있습니다.
10진법 부동 소수점 리터럴은 가수 (decimal fraction), 지수 (decimal exponent) 중 하나만 있거나 둘 모두의 순서로 구성됩니다. 가수는 소수점 (.
) 과 일련의 소수 자릿수로 구성됩니다. 지수는 대문자 또는 소문자 e
접두사 다음에 e
앞의 값에 10의 거듭 제곱을 곱한 것을 나타내는 10진수로 구성됩니다. 예를 들어 1.25e2
는 1.25 x 10² 을 나타내고 125.0
입니다. 유사하게 1.25e-2
는 1.25 x 10⁻² 를 나타내고 0.0125
입니다.
16진법 부동 소수점 리터럴은 0x
접두사 다음으로 선택적으로 지수 (hexadecimal exponent) 뒤에 가수 (hexadecimal fraction) 로 구성됩니다. 가수는 소수점과 일련의 16진수로 구성됩니다. 지수는 대문자 또는 소문자 p
접두사 다음에 p
앞의 값에 2의 거듭 제곱을 곱한 것을 나타내는 10진수로 구성됩니다. 예를 들어 0xFp2
는 15 x 2² 를 나타내고 60
입니다. 유사하게 0xFp-2
는 15 x 2⁻² 를 나타내고 3.75
입니다.
음수 부동 소수점 리터럴은 -42.5
와 같이 부동 소수점 리터럴 앞에 마이너스 기호 (-
) 를 추가하여 표현됩니다.
가독성을 위해 숫자 사이에 언더바 (_
)를 허용하지만 무시되므로 리터럴 값에 영향을 주지 않습니다. 부동 소수점 리터럴은 0
으로 시작될 수 있지만 마찬가지로 무시되므로 리터럴의 기준이나 값에 영향을 주지 않습니다.
달리 지정하지 않는 한 부동 소수점 리터럴의 기본 유추 타입은 64-비트 부동 소수점 숫자인 Swift 표준 라이브러리 타입 Double
입니다. Swift 표준 라이브러리는 32-비트 부동 소수점 숫자인 Float
타입도 정의합니다.
Grammar of a floating-point literal:
floating-point-literal → decimal-literal decimal-fraction? decimal-exponent? floating-point-literal → hexadecimal-literal hexadecimal-fraction? hexadecimal-exponent
decimal-fraction →
.
decimal-literal decimal-exponent → floating-point-e sign? decimal-literalhexadecimal-fraction →
.
hexadecimal-digit hexadecimal-literal-characters? hexadecimal-exponent → floating-point-p sign? decimal-literalfloating-point-e →
e
|E
floating-point-p →p
|P
sign →+
|-
문자열 리터럴 (String Literals)
문자열 리터럴은 따옴표로 묶인 일련의 문자입니다. 한 줄 문자열 리터럴은 쌍따옴표로 묶이며 형식은 다음과 같습니다:
문자열 리터럴은 이스케이프 처리되지 않은 (unescaped) 쌍따옴표 ("
), 이스케이프 처리되지 않은 역슬래시 (\
), 캐리지 리턴 또는 줄바꿈을 포함할 수 없습니다.
여러줄 문자열 리터럴은 3개의 쌍따옴표로 묶이며 형식은 다음과 같습니다:
한 줄 문자열 리터럴과 다르게 여러줄 문자열 리터럴은 이스케이프 처리되지 않은 쌍따옴표 ("
), 캐리지 리턴, 그리고 줄바꿈을 포함할 수 있습니다. 이스케이프 처리되지 않은 쌍따옴표 3개를 나란히 포함할 수 없습니다.
여러줄 문자열 리터럴을 시작하는 """
뒤의 줄바꿈은 문자열의 부분이 아닙니다. 리터럴 종료를 나타내는 """
전의 줄바꿈도 문자열의 부분이 아닙니다. 줄바꿈으로 시작하거나 끝나는 여러줄 문자열 리터럴을 만드려면 첫번째 또는 마지막 줄에 빈 줄을 작성해야 합니다.
여러줄 문자열 리터럴은 공백과 탭의 조합을 사용하여 들여쓰기 할 수 있습니다: 이 들여쓰기는 문자열에 포함되지 않습니다. 리터럴을 종료하는 """
이 들여쓰기를 결정합니다: 리터럴에서 공백이 아닌 모든 줄은 닫는 """
앞에 나타나는 동일한 들여쓰기로 시작해야 합니다; 탭과 공백 사이에는 변환이 없습니다. 들여쓰기 후에 추가 공백과 탭을 포함할 수 있습니다; 이러한 공백과 탭은 문자열에 나타납니다.
여러줄 문자열 리터럴의 줄바꿈은 줄바꿈 문자를 사용하는 것이 일반적입니다. 소스 파일에 캐리지 리턴과 줄바꿈이 혼합되어 있더라도 문자열의 줄바꿈은 모두 동일합니다.
여러줄 문자열 리터럴에서 줄 끝에 역슬래시 (\
)를 작성하면 문자열에서 줄바꿈이 생략됩니다. 역슬래시와 줄바꿈 사이의 공백도 생략됩니다. 이 구문을 사용하여 결과 문자열의 값을 변경하지 않고 소스 코드에 여러줄 문자열 리터럴을 래핑할 수 있습니다.
다음 이스케이프 시퀀스를 사용하여 한 줄과 여러줄 형식의 문자열 리터럴에 특수 문자를 포함할 수 있습니다:
Null 문자 (
\0
)역슬래시 (
\\
)가로 ()
줄바 ()
캐리지 리턴 ()
쌍따옴 (
\"
)홑따옴 (
\'
)유니코드 스칼 (
\u{
n}
), n 은 8자리 숫자로 구성된 16진법 입니다.
표현식의 값은 역슬래시 (\
) 뒤 소괄호 안에 표현식을 위치시켜 문자열 리터럴에 삽입할 수 있습니다. 삽입된 표현식은 문자열 리터럴을 포함할 수 있지만 이스케이프 되지않은 역슬래시, 캐리지 리턴, 또는 줄바꿈을 포함할 수 없습니다.
예를 들어 아래의 문자열 리터럴은 동일한 값을 가집니다:
확장된 구분기호 (extended delimiters)로 구분된 문자열은 따옴표로 묶인 일련의 문자와 하나 이상의 숫자 기호 (#
)의 집합입니다. 확장된 구분기호로 구분된 문자열의 형식은 다음과 같습니다:
확장된 구분기호로 구분된 문자열에서 특수문자는 일반 문자로 결과 문자열에 나타납니다. 확장된 구분기호를 사용하여 문자열 보간 생성, 이스케이프 시퀀스 시작, 또는 문자열 종료와 같은 특수 효과를 가지는 문자로 문자열을 만들 수 있습니다.
다음의 예제는 동일한 문자열 값을 생성하는 문자열 리터럴과 확장된 구분기호로 구분된 문자열을 보여줍니다:
확장된 구분기호로 구분된 문자열에 둘 이상의 숫자 기호를 사용하는 경우 숫자 기호 사이에 공백이 있으면 안됩니다:
확장된 구분기호를 사용하여 생성한 여러줄 문자열 리터럴은 일반적인 여러줄 문자열 리터럴과 동일한 들여쓰기 요구사항을 가집니다.
문자열 리터럴의 기본 유추 타입은 String
입니다. String
타입에 대한 자세한 설명은 문자열과 문자 (Strings and Characters) 와 String
에서 확인 가능합니다.
+
연산자로 연결된 문자열 리터럴은 컴파일 시 연결됩니다. 예를 들어 아래 예제의 textA
와 textB
의 값은 동일하며 런타임 연결이 수행되지 않습니다.
Grammar of a string literal:
string-literal → static-string-literal | interpolated-string-literal
string-literal-opening-delimiter → extended-string-literal-delimiter?
"
string-literal-closing-delimiter →"
extended-string-literal-delimiter?static-string-literal → string-literal-opening-delimiter quoted-text? string-literal-closing-delimiter static-string-literal → multiline-string-literal-opening-delimiter multiline-quoted-text? multiline-string-literal-closing-delimiter
multiline-string-literal-opening-delimiter → extended-string-literal-delimiter?
"""
multiline-string-literal-closing-delimiter →"""
extended-string-literal-delimiter? extended-string-literal-delimiter →#
extended-string-literal-delimiter?quoted-text → quoted-text-item quoted-text? quoted-text-item → escaped-character quoted-text-item → Any Unicode scalar value except
"
,\
, U+000A, or U+000Dmultiline-quoted-text → multiline-quoted-text-item multiline-quoted-text? multiline-quoted-text-item → escaped-character multiline-quoted-text-item → Any Unicode scalar value except
\
multiline-quoted-text-item → escaped-newlineinterpolated-string-literal → string-literal-opening-delimiter interpolated-text? string-literal-closing-delimiter interpolated-string-literal → multiline-string-literal-opening-delimiter multiline-interpolated-text? multiline-string-literal-closing-delimiter
interpolated-text → interpolated-text-item interpolated-text? interpolated-text-item →
\(
expression)
| quoted-text-itemmultiline-interpolated-text → multiline-interpolated-text-item multiline-interpolated-text? multiline-interpolated-text-item →
\(
expression)
| multiline-quoted-text-itemescape-sequence →
\
extended-string-literal-delimiter escaped-character → escape-sequence0
| escape-sequence\
| escape-sequencet
| escape-sequencen
| escape-sequencer
| escape-sequence"
| escape-sequence'
escaped-character → escape-sequenceu
{
unicode-scalar-digits}
unicode-scalar-digits → Between one and eight hexadecimal digitsescaped-newline → escape-sequence inline-spaces? line-break
정규 표현식 리터럴 (Regular Expression Literals)
정규 표현식 리터럴 (regular expression literal) 은 아래와 같이 슬래시 (/
) 로 감싸있는 문자의 시퀀스 입니다:
정규 표현식 리터럴은 탭 또는 스페이스로 시작되지 않아야 하며, 이스케이프 처리되지 않은 슬래시 (unescaped slash), 캐리지 리턴 (carriage return), 또는 줄바꿈을 포함할 수 없습니다.
정규 표현식에서의 역슬래시는 문자열 리터럴와 같이 이스케이프 문자가 아닌 정규 표현식의 부분으로 인식합니다. 역슬래시는 다음의 특수 문자는 문자 그대로 해석되거나 다음의 일반 문자는 특별한 방법으로 해석됨을 나타냅니다. 예를 들어, /\(/
은 단일 왼쪽 괄호이며 /\d/
은 단일 숫자입니다.
확장된 구분 기호로 구분된 정규 표현식 리터럴은 슬래시 (/
) 로 감싸있는 문자의 시퀀스와 하나 이상의 쌍으로 숫자 기호 (#
) 로 되어있습니다. 확장된 구분 기호로 구분된 정규 표현식 리터럴은 다음의 형식을 가집니다:
확장된 구분 기호를 사용한 정규 표현식 리터럴은 이스케이프 처리되지 않은 스페이스 또는 탭으로 시작할 수 있고 이스케이프 처리되지 않은 슬래시 (/
), 그리고 여러줄로 작성될 수 있습니다. 여러줄 정규 표현식 리터럴은 시작 구분자는 라인의 끝에 있어야 하고 끝나는 구분자는 해당 라인에 있어야 합니다. 여러줄 정규 표현식 리터럴에서 확장된 정규 표현식은 기본적으로 가능합니다 — 특히, 공백은 무시되고 주석은 허용됩니다.
확장된 구분자에 의해 구분된 정규 표현식 리터럴 형식에 하나 이상의 숫자 기호를 사용한다면 숫자 기호 사이에 공백이 있을 수 없습니다:
빈 정규 표현식 리터럴을 만드려면 확장된 구분자 구문을 사용해야 합니다.
Grammar of a regular expression literal:
regular-expression-literal → regular-expression-literal-opening-delimiter regular-expression regular-expression-literal-closing-delimiter regular-expression → Any regular expression
regular-expression-literal-opening-delimiter → extended-regular-expression-literal-delimiter?
/
regular-expression-literal-closing-delimiter →/
extended-regular-expression-literal-delimiter?extended-regular-expression-literal-delimiter →
#
extended-regular-expression-literal-delimiter?
연산자 (Operators)
Swift 표준 라이브러리는 사용할 수 있는 여러가지 연산자를 정의하며 기본 연산자 (Basic Operators) 와 고급 연산자 (Advanced Operators) 에 설명되어 있습니다. 이 섹션에서는 사용자 지정 연산자 (Custom operators)를 정의하는데 사용될 수 있는 문자를 설명합니다.
사용자 지정 연산자는 ASCII 문자 /
, =
, -
, +
, !
, *
, %
, <
, >
, &
, |
, ^
, ?
, 또는 ~
중 하나로 시작하거나 아래 문법에 정의된 유니코드 문자 중 하나로 시작할 수 있습니다 (수학적 연산자 (Mathematical Operators), 기타 기호 (Miscellaneous Symbols) 와 딩뱃 유니코드 (Dingbats Unicode) 블럭의 문자를 포함합니다). 첫번째 문자 뒤에 유니코드 문자를 결합하는 것도 가능합니다.
점 (.
) 으로 시작하는 사용자 지정 연산자도 정의할 수 있습니다. 이러한 연산자는 추가 점을 포함할 수 있습니다. 예를 들어 .+.
은 단일 연산자로 취급됩니다. 연산자가 점으로 시작하지 않으면 다른 곳에 점을 포함할 수 없습니다. 예를 들어 +.+
은 +
연산자 다음에 .+
연산자로 처리됩니다.
물음표 (?
) 를 포함하여 사용자 지정 연산자를 정의할 수 있지만 단일 물음표 문자로만 구성될 수 없습니다. 또한 연산자에 느낌표 (!
) 를 포함할 수 있지만 접미사 연산자 (postfix operators) 는 물음표나 느낌표로 시작될 수 없습니다.
Note 토큰
=
,->
,//
,/*
,*/
,.
, 접두사 연산자<
,&
, 그리고?
, 중위 연산자?
, 그리고 접미사 연산자>
,!
, 그리고?
는 예약되어 있습니다. 이러한 토큰은 오버로드 할 수 없으며 사용자 지정 연산자로 사용할 수 없습니다.
연산자 주변에 공백은 연산자가 접두사 연산자 (prefix operator), 접미사 연산자 (postfix operator), 또는 이항 연산자 (binary operator) 로 사용되는지 결정하기 위해 사용됩니다. 이 동작은 다음 규칙에 정리되어 있습니다:
연산자 주변 양쪽에 모두 공백이 있거나 없는 경우 이항 연산자로 처리됩니다. 예를 들어
a+++b
와a +++ b
에 연산자+++
는 이항 연산자로 처리됩니다.연산자가 왼쪽에만 공백이 있다면 접두사 단항 연산자 (prefix unary operator)로 처리됩니다. 에를 들어
a +++b
에서+++
연산자는 접두사 단항 연산자로 처리됩니다.연산자가 오른쪽에만 공백이 있다면 접미사 단항 연산자 (postfix unary operator)로 처리됩니다. 예를 들어
a+++ b
에서+++
연산자는 접미사 단항 연산자로 처리됩니다.연산자 왼쪽에 공백이 없지만 바로 이어서 점 (
.
) 이 오면 접미사 단항 연산자로 처리됩니다. 예를 들어a+++.b
에서+++
연산자는 접미사 단항 연산자로 처리됩니다 (a +++ .b
가 아닌a+++ .b
).
이러한 규칙의 목적에 따라 연산자 앞의 문자 (
, [
, 그리고 {
연산자 뒤의 문자 )
, ]
, 그리고 }
, 그리고 문자 ,
, ;
, 그리고 :
도 공백으로 간주합니다.
미리 정의된 연산자 !
또는 ?
에 왼편에 공백이 없다면 오른편에 공백 여부와 상관없이 접미사 연산자로 처리됩니다. 옵셔널 체이닝 연산자 (optional-chaining operator)로 ?
을 사용하려면 왼편에 공백을 가지면 안됩니다. 삼항 조건부 연산자 (ternary conditional operator) (?
:
) 로 사용하려면 반드시 양쪽에 공백이 있어야 합니다.
중위 연산자 (infix operator)에 인수 중 하나가 정규 표현식 리터럴이라면 연산자는 양쪽에 공백을 가져야 합니다.
특정 구문에서 선행으로 <
또는 >
연산자는 둘 이상의 토큰으로 분리될 수 있습니다. 나머지는 동일한 방식으로 처리되고 다시 분리될 수 있습니다. 그 결과로 Dictionary<String, Array<Int>>
와 같은 구문에서 닫는 >
문자 사이를 명확하게 하기 위해 공백을 추가할 필요가 없습니다. 예를 들어 닫는 >
문자는 비트 시프트 >>
연산자로 잘못 해석될 수 있는 단일 토큰으로 처리되지 않습니다.
새로운 사용자 정의 연산자를 정의하는 방법을 알아보려면 사용자 정의 연산자 (Custom Operators) 와 연산자 선언 (Operator Declaration) 을 참고 바랍니다. 기존 연산자를 오버로드 하는 방법을 알아보려면 연산자 메서드 (Operator Methods) 를 참고 바랍니다.
Grammar of operators:
operator → operator-head operator-characters? operator → dot-operator-head dot-operator-characters
operator-head →
/
|=
|-
|+
|!
|*
|%
|<
|>
|&
||
|^
|~
|?
operator-head → U+00A1–U+00A7 operator-head → U+00A9 or U+00AB operator-head → U+00AC or U+00AE operator-head → U+00B0–U+00B1 operator-head → U+00B6, U+00BB, U+00BF, U+00D7, or U+00F7 operator-head → U+2016–U+2017 operator-head → U+2020–U+2027 operator-head → U+2030–U+203E operator-head → U+2041–U+2053 operator-head → U+2055–U+205E operator-head → U+2190–U+23FF operator-head → U+2500–U+2775 operator-head → U+2794–U+2BFF operator-head → U+2E00–U+2E7F operator-head → U+3001–U+3003 operator-head → U+3008–U+3020 operator-head → U+3030operator-character → operator-head operator-character → U+0300–U+036F operator-character → U+1DC0–U+1DFF operator-character → U+20D0–U+20FF operator-character → U+FE00–U+FE0F operator-character → U+FE20–U+FE2F operator-character → U+E0100–U+E01EF operator-characters → operator-character operator-characters?
dot-operator-head →
.
dot-operator-character →.
| operator-character dot-operator-characters → dot-operator-character dot-operator-characters?infix-operator → operator prefix-operator → operator postfix-operator → operator
Last updated
Was this helpful?