NOTE阅读文档版本:
语言规约 Cangjie-0.53.18-Spec
具体开发指南 Cangjie-LTS-1.0.3
在阅读 了解仓颉的语言规约时, 难免会涉及到一些仓颉的示例代码, 但 我们对仓颉并不熟悉, 所以可以用 仓颉在线体验 快速验证
有条件当然可以直接 配置Canjie-SDK
WARNING博主在此之前, 基本只接触过C/C++语言, 对大多现代语言都没有了解, 所以在阅读过程中遇到相似的概念, 难免会与C/C++中的相似概念作类比, 见谅
此样式内容, 表示文档原文内容
终于到包和模块管理了
包和模块管理
在仓颉编程语言中, 程序以包的形式进行组织, 包是最小的编译单元
包可以定义子包, 从而构成树形结构
没有父包的包称为
root包,root包及其子包(包括子包的子包)构成的整棵树称为module
module的名称与root包相同
module是仓颉的最小发布单元包由一个或多个源码文件组成, 同一个包的源码文件必须在同一个目录, 并且同一个目录里的源码文件只能属于同一个包
子包的目录是其父包目录的子目录
仓颉中, 包可以拥有子包, 没有父包就是root包, root包及其子包构成整个module
module是仓颉的最小发布单元, 包是最小编译单元
包
包的声明
包声明以关键字
package开头, 后接root包至当前包路径上所有包的包名, 以.分隔(路径本身不是包名)包声明的语法如下:
packageHeader: packageModifier? (MACRO NL*)? PACKAGE NL* fullPackageName end+;fullPackageName: (packageNameIdentifier NL* DOT NL*)* packageNameIdentifier;packageNameIdentifier: Ident| contextIdent;packageModifier: PUBLIC| PROTECTED| INTERNAL;每个包都有包名, 包名是这个包可唯一识别的标识符
除
root包外, 包名必须和其所在的目录名一致包声明必须在文件的首行(注释和空白字符不计), 每个文件只能有一个
package声明特别地,
root包的文件可以不声明package, 对于不包含package声明的文件, 它会用default作为包名./src/main.cj // 省略包声明相当于'package default'main() {println("Hello World")}
package可以被internal、protected或者public修饰
package的默认修饰符(默认修饰符是指在省略情况下的修饰符语义, 这些默认修饰符也允许显式写出)为public同一个包在不同文件中的
package声明必须使用相同的访问修饰符修饰特别地,
root包不能被internal或者protected修饰
internal表示仅当前包及子包(包括子包的子包)内可见当前包的子包(包括子包的子包)内可以导入这个包或者这个包的成员
protected表示仅当前module内可见同一个
module内的其它包可以导入这个包或者这个包的成员, 不同module的包无法访问
public表示module内外均可见其它包可以导入这个包或者这个包的成员
仓颉中, 声明包的语法是包修饰词 package 包名
在.cj文件中声明包, 就表示此文件属于所声明的包, 当然 前提是目录结构合法
如果不显式声明包, 则package default
包名是一个路径, 如果是子包, 需要声明为package 父包.子包, 用.分割路径
包的成员
包的成员是在顶层声明的类、接口、
struct、enum、类型别名、全局变量、扩展、函数当前包的父包和子包 并不是当前包的成员, 访问父包或者子包需要 包的导入机制, 未被导入的包名不在
top-level作用域中如下所示的例子中,
package a.b是package a的子包src/a.cj package alet a = 0 // ok// src/b/b.cjpackage a.blet a = 0 // oklet b = 0 // ok如下所示的例子中,
package a.b是package a的子包src/a.cj package alet u = 0 // oklet _ = b.x // Error: 未声明的标识符 'b'let _ = a.u // Error: 未声明的标识符 'a'let _ = a.b.x // Error: 未声明的标识符 'a'// src/b/b.cjpackage a.blet x = 1 // oklet _ = a.u // Error: 未声明的标识符 'a'let _ = a.b.x // Error: 未声明的标识符 'a'let _ = b.x // Error: 未声明的标识符 'b'特别地, 子包不能和当前包的成员同名, 这是为了保证访问路径中的名称是唯一的
不能尝试通过当前包的包名访问当前包的成员
访问修饰符
仓颉中, 可以使用访问修饰符来保护对类型、变量、函数等元素的访问
仓颉有 4 种不同的访问修饰符
private
internal
protected
public
这四种访问修饰符, 并不只是修饰包用的
修饰顶层元素
在修饰顶层元素时不同访问修饰符的语义如下:
private表示仅当前文件内可见不同的文件无法访问这类成员
internal表示仅当前包及子包(包括子包的子包)内可见同一个包内可以不导入就访问这类成员, 当前包的子包(包括子包的子包)内可以通过导入来访问这类成员
protected表示仅当前module内可见同一个包的文件可以不导入就访问这类成员, 不同包但是在同一个
module内的其它包可以通过导入访问这些成员, 不同module的包无法访问
public表示module内外均可见同一个包的文件可以不导入就访问这类成员, 其它包可以通过导入访问这些成员
File Package & Sub-Packages Module All Packages privateY N N N internalY Y N N protectedY Y Y N publicY Y Y Y 不同顶层声明支持的访问修饰符和默认修饰符规定如下:
pacakge支持使用internal、protected、public, 默认修饰符为public
import支持使用全部访问修饰符, 默认修饰符为private其他顶层声明支持使用全部访问修饰符, 默认修饰符为
internal
除internal之外, C++中也存在另外三个修饰词, 但 C++中的访问修饰符是用于类成员的, 用来声明成员可访问性
仓颉中的访问修饰符, 还可以修饰包成员的可访问性
修饰非顶层成员
在修饰非顶层成员时不同访问修饰符的语义如下:
private表示仅当前类型或扩展定义内可见
internal表示仅当前包及子包(包括子包的子包)内可见
protected表示当前module及当前类的子类可见
public表示module内外均可见
Type/Extend Package & Sub-Packages Module & Sub-Classes All Packages privateY N N N internalY Y N N protectedY Y Y N publicY Y Y Y 类型成员的访问修饰符 可以不同于 类型本身
除接口外类型成员的默认修饰符(默认修饰符是指在省略情况下的修饰符语义, 这些默认修饰符也允许显式写出)是
internal接口中的成员函数和属性不可以写访问修饰符, 它们的访问级别等同于
public
包内可见, 即表示 在本包内定义的实例, 可以通过实例访问类成员
protected是module以及子类可以见的, 也就表示 如果不同属一个module, 此类成员是无法访问的
protected和internal, 这两个修饰符, 在刚接触包可能会出现混淆:
一个是module及子类可见, 一个是当前包及子包可见, 但module就是一个包含父子关系的包链, 那么这两个有什么区别?
区别在于, protected修饰类成员, 父包也是可见的, 而internal只能当前包和子包
而private和public则是两个极端, 只类内可见 或 全部可见没有限制
访问修饰符的合法性检查
仓颉的访问级别排序为
public>protected>internal>private类型的访问级别:
非泛型类型的访问级别 由 类型声明的访问修饰符 决定
泛型实例化类型的访问级别等同于该泛型类型与该泛型类型实参的访问级别中最低的一个
一个声明的访问修饰符 不得高于 该声明中用到的类型的访问修饰符的级别
具体地:
变量、属性声明的访问级别不得高于其类型的访问级别
函数声明的访问级别不得高于参数类型、返回值类型, 以及
where约束中的类型上界的访问级别类型别名的访问级别不得高于原类型的访问级别
类型声明的访问级别不得高于
where约束中的类型上界的访问级别子包的访问级别不得高于其父包的访问级别
import的访问修饰符不得高于其导入声明的访问级别private open class A {}protected let a = A() // error: 使用 private 类型 A, 声明 protected 变量 alet (a, b) = (A(), 1) // error: 使用 private 类型 A, 声明 internal 变量 afunc f(_: A) {} // error: 使用 private 类型 A, 声明 internal 函数 ffunc f() { A() } // error: 使用 private 类型 A, 声明 internal 函数 ffunc f<T>() where T <: A {} // error: 使用 private 类型 A, 声明 internal 函数 fpublic type X = A // error: 使用 private 类型 A, 声明 public 类型 Xpublic type ArrayA = Array<A> // error: 使用 private 类型 A, 声明 public 类型 ArrayAprotected struct S<T> where T <: A {} // error: 使用 private 类型 A, 约束 protected struct S<T>// src/a.cjpublic package a// src/a/b/b.cjprotected package a.b // ok// src/a/b/c/c.cjpublic package a.b.c // error
当你在使用一个类型时, 可能使用这个类型进行 定义变量、声明别名、导入此包 等
这些操作也可以使用访问修饰符修饰, 所以你不能 在进行这些操作的时候 尝试使用更大权限的修饰符去进行提权
特别地, 类继承时 子类访问级别 与 父类访问级别、类型实现/继承接口时 子类型访问级别 与 父接口访问级别 不受上述规则限制
private open class A {}public enum E { U | V }interface I {}public class C <: A {} // okpublic interface J <: I {} // okextend E <: I {} // ok
继承和实现接口时, 不需要在意访问修饰符的限制
包的导入
导入是一种用来将其他包或其他包中的成员引入到当前仓颉程序中的机制
当源码中没有
import声明的时候, 当前文件只能访问 当前包中的成员 和 编译器默认导入的成员通过
import声明, 可以让编译器在编译这个仓颉文件时 找到所需要的外部名称
import语句在文件中的位置必须在包声明之后, 其他声明或定义之前
import相关的语法如下:importList: importModifier? NL* IMPORT NL* importContent end+;importSingle: (packageNameIdentifier NL* DOT NL*)* (identifier | packageNameIdentifier);importSpecified: (identifier '.')+ identifier;importAlias: importSingle NL* AS NL* identifier;importAll: (packageNameIdentifier NL* DOT NL*)+ MUL;importMulti: (packageNameIdentifier NL* DOT NL*)* LCURL NL*(importSingle | importAlias | importAll) NL*(COMMA NL* (importSingle | importAlias | importAll))* NL*COMMA? NL* RCURL;
import语法有如下几种形式:
单导入
别名导入
全导入
先导入包, 才能使用包中可访问的成员
就像C/C++中引入头文件, 但并不是头文件, 原理也不同
可以导入包, 也可以导入包的子包, 可以直接导入目标包的所有成员, 也可以单独导入包的成员
导入包需要导入目标包的完整路径
通过
import, 可以导入一个或多个其他包或者其他包中的成员, 也可以通过as语法为导入的名称定义别名如果导入的名称是包, 则可以用它继续访问包中的成员(子包不是包的成员), 但包名本身不能作为表达式
package apublic let x = 0package demoimport amain() {println(a.x) // ok, prints 0}
导入的包, 包名本身不能作为表达式
导入包时, 可以通过as为导入的内容取别名:import a as someIdent
任意包和包之间不能产生循环依赖, 即使是同一个
module下的包之间也不可以对于任意两个包
p1和p2, 如果p1导入了p2或者p2的成员, 那么我们称p1和p2具有依赖关系,p1依赖p2依赖关系具有传递性, 如果
p1依赖p2,p2依赖p3, 那么p1依赖p3包的循环依赖是指存在包相互依赖的情况
package p.aimport p.b // errorpacakge p.bimport p.a // error禁止使用
import导入当前包或当前包中的成员package aimport a // errorimport a.x // errorpublic let x = 0
包循环依赖是禁止的, 即 不允许两个包互相导入
导入的成员的作用域级别 低于 当前包声明的成员
导入的非函数成员会被当前包的同名成员遮盖; 导入的函数成员 若可以和当前包的同名函数构成重载, 调用时会根据 [泛型函数重载] 和 [函数重载] 的规则进行函数决议; 导入的函数成员若和当前包的同名函数不构成重载, 则按照遮盖处理
package apublic let x = 0public func f() {}import a.x // Warning: 导入的 x 被遮盖import a.flet x = 1func f(x: Int64) { x }let _ = f() // ok, 找到 导入的 a.flet _ = f(1) // ok, 找到 在本包中定义的 f
导入的包的成员, 是可以与当前包中的成员构成重载或遮盖的
单导入
单导入语法用来导入单个成员, 目标成员必须是对当前包可见的
导入的成员名称会作为当前作用域内可以访问的名称
import语法中的路径最后一个名称表示指定的成员, 这个名称可以是顶层变量、函数、类型, 也可以是包下面是导入顶层变量、函数、类型的例子:
有两个包分别是
a和b, 在b包中导入a包的成员package apublic let x = 0public func f() { 0 }public class A {}import a.ximport a.fimport a.Aprivate func g(_: A) { x + f() } // ok
单导入, 是指导入某个包, 或包中的指定可见成员
需要导入完整的路径, 最后一个标识符可以在包内直接使用
如下所示的例子中,
c是a的子包package a.cpublic let y = 1import aprivate func g(_: a.A) { a.x + a.f() } // okprivage func h(_: A) { // error: 未声明的标识符 Ax + f() // error: 未声明的标识符 x and f}let _ = a.c.y // error: c 不是 a 的成员let _ = a // error: 未声明的标识符 aimport a.clet _ = c.y // ok单导入的成员被当前包成员遮盖时, 编译器会给出告警提示无用导入
import a.x // warning: 导入的 x 被遮盖import a.f // warning: 导入的 f 被遮盖func f() { 1 }let x = 1let _ = f() // ok, 调用在本包中定义的 f(), 值为 1
单导入, 如果导入包, 则可以通过包名访问目标包的可见成员
别名导入
别名导入可以使用
as语法为导入成员重命名以别名导入的内容, 在当前包中只会以别名的形式引入作用域, 而不会引入原来的名称(但不禁止分别导入原名和别名)
导入的内容可以是包或者包的成员
package apublic let x = 0public let y = 1public func f() { 0 }import a as pkgAimport a.x as x1import a.x as x2 // oklet _ = 5 // error: 未声明的标识符 'x'let _ = a.x // error: 未声明的标识符 'a'let _ = x1 // oklet _ = x2 // oklet _ = pkgA.x // oklet _ = pkgA.x1 // error: 'x1' 不是 'pkgA' 的成员
全导入
全导入通过
*语法导入其他包中所有对当前包可见的顶层成员(不包括子包)示例如下:
package apublic let x = 0public func f() { 0 }public class A {}import a.*private func g(_: A) { x + f() } // ok与单导入不同, 当全导入的成员被当前包成员遮盖时, 编译器不会给出告警
import a.*let x = 1func f() { x } // ok, x 定义在本包中let _ = f() // ok, 调用在本包中定义的 f(), 值为 1
全导入, 顾名思义 即 一次性导入目标包中的所有可见成员
导入的成员同样可以构成 重载和遮盖
如果导入的成员 不被当前包的成员遮盖, 但多个导入成员重名时, 编译器不会给出告警
但如果这些重名的导入不构成重载, 这个名字在本包中不可用, 在使用该名称时 编译器会因无法找到唯一的名称而报错
package bpublic let x = 1public func f(x: Int64) { x }import a.*import b.*let _ = x // error: 不可确定的 x如果导入的重名成员可以构成函数重载, 调用时会根据 [泛型函数重载] 和 [函数重载] 的规则进行函数决议
import a.*import b.*func f(b: Bool) { b }let _ = f() // ok, 调用 a.flet _ = f(1) // ok, 调用 b.flet _ = f(true) // ok, 调用在本包中定义的 f()
导入多个不构成遮盖也不构成重载的同名成员时, 不会警告, 只是会在调用时无法找到唯一可用名称报错
带访问修饰符的全导入 不会导入 比其访问级别低的声明
package aprotected import a.b.*let _ = x // oklet _ = y // oklet _ = z // error: 未声明的标识符 'z'package a.bpublic let x = 0protected let y = 1internal let z = 2
包导入时, 也是可以使用访问修饰符的, 可以在导入成员时 指定原包中满足目标可访问等级的成员被导入
批量导入
批量导入使用
{}语法, 在一个import声明里同时导入多个成员通常用来省略重复的包路径前缀
批量导入的
{}中支持单导入、别名导入和全导入, 但不允许嵌套批量导入import std.{time,fs as fileSystem,io.*,collection.{ HashMap, HashSet } // syntax error}
{}的前缀可以为空import {std.time,std.fs as fileSystem,std.io.*,}使用批量导入语法与使用多个独立
import的语法是等价的import std.{os.process,time,io.*,fs as fileSystem}等价于:
import std.os.processimport std.timeimport std.io.*import std.fs as fileSystem
嵌套导入, 可以在{}前加上包路径, 然后在{}内批量添加要导入的成员, 用, 分隔
导入名称冲突检查
如果多个单导入的名称产生重名(包括重复导入)且不构成函数重载, 并且该名字在本包中没有被遮盖, 编译器会给出名称冲突告警, 这个名字在本包中不可用, 在使用该名称时编译器会因无法找到唯一的名称而报错
若该名称被当前包成员遮盖时, 编译器会给出告警提示无用导入
package bpublic let x = 1public func f(x: Int64) { x }package cpublic let f = 0import a.x // warning: 导入的 'x' 被遮盖import a.x // warning: 导入的 'x' 被遮盖import b.x // warning: 导入的 'x' 被遮盖let x = 0let y = x // y = 0import a.ximport a.x // warning: 'x' 已经被导入了import b.x // warning: 'x' 已经被导入了let _ = x // error: 无法确定的 'x'如果导入的重名成员之间或者导入的成员与当前包中的同名函数之间可以构成函数重载, 调用时会根据 [泛型函数重载] 和 [函数重载] 的规则进行函数决议
import a.fimport b.ffunc f(b: Bool) { b }let _ = f() // ok, 调用 'a.f'let _ = f(1) // ok, 调用 'b.f'let _ = f(true) // ok, 调用 在本包中定义的 f()
当重复导入 但发生遮盖时, 不会出现错误, 只会出现被遮盖的警告
当重复导入 发生重载时, 更可以正常的使用
只有重复导入, 但没有发生重载也没有发生遮盖, 才会出现无法确定的目标的错误
多个别名导入同名, 或者别名导入 和本包定义同名时的处理规则 与单导入相同
import a.x as x1 // warning: 导入的 x1 被遮盖let x1 = 10let _ = x1 // ok, 'x1' 在本包中被定义package bpublic let x = 1public func f(x: Int64) { x }import a.x as x1import a.x as x1 // warning: 'x1' 已经被导入import b.x as x1 // warning: 'x1' 已经被导入let _ = x1 // error: 无法确定的 'x1'import a.f as gimport b.f as gfunc g(b: Bool) { b }let _ = g() // ok, 调用 'a.f'let _ = g(1) // ok, 调用 'b.f'let _ = g(true) // ok, 调用 在本包中定义的 'g'如果导入名称冲突的其中一方来自全导入, 这种情况下编译器也不会给出报警, 但冲突的声明都不可用
批量导入依据其等价的单导入、别名导入、多导入做名称冲突检查
当导入的别名冲突时, 与单导入冲突处理相同
被遮盖就不用, 构成重载就按照重载规则调用
import的访问修饰符
import可以被private、internal、protected、public访问修饰符修饰其中, 被
public、protected或者internal修饰的import可以把导入的成员重导出(如果这些导入的成员没有因为名称冲突或者被遮盖导致在本包中不可用)其他包可以根据 [访问修饰符] 的访问规则通过
import导入这些被重导出的对象具体地:
private import表示导入的内容仅当前文件内可访问,private是import的默认修饰符, 不写访问修饰符的import等价于private import
internal import表示导入的内容在当前包及其子包(包括子包的子包)均可访问, 非当前包访问需要显式import
protected import表示导入的内容在当前module内都可访问, 非当前包访问需要显式import
public import表示导入的内容外部都可访问, 非当前包访问需要显式import
包导入也可以使用访问修饰符
如果导入其他成员, 则可以使用public、protected、internal修饰, 这些导入的成员 可以按照访问修饰符规则被重导出
但, 按照全导入时介绍的规则, 如果使用访问修饰符 修饰import, 那么只能导入目标包中满足访问修饰符限制的成员
在下面的例子中,
b是a的子包, 在a中通过public import重导出了b中定义的函数fpackage apublic let x = 0public import a.b.finternal package a.bpublic func f() { 0 }import a.f // oklet _ = f() // okimport a.f // ok//// case 1package demopublic import std.time.Duration // warning: 导入的 'Duration' 被遮盖struct Duration {}./a.cj //// case 2package demopublic import std.time.Duration// ./b.cjpackage demofunc f() {let a: Duration = Duration.second // ok, 访问重导出的 'Duration'}./a/a.cj //// case 3package demo.apublic let x = 0// ./b/b.cjpackage demo.bpublic import demo.a.* // warning: 导入的 'x' 被遮盖, 将不能重导出 'demo.a.x'var x = 0./a/a.cj //// case 4package demo.apublic let x = 0// ./b/b.cjpackage demo.bpublic let x = 0// ./c/c.cjpackage demo.cpublic import demo.a.* // warning, 因为存在重复名称, 将不能重导出 'demo.a.x'public import demo.b.* // warning, 因为存在重复名称, 将不能重导出 'demo.b.x'特别地, 包不可以被重导出: 如果被
import导入的是包, 那么该import不允许被public、protected或者internal修饰public import a.b // error: 不能重新导出包
如果是导入的包名, 只能用private即 默认修饰符
重导出, 非当前包才需要 显式import
被遮盖的不能重导出