[COMPOSER] PHP Autoloading, PSR4 and Composer
https://viblo.asia/p/php-autoloading-psr4-and-composer-V3m5Wy0QZO7
Last updated
https://viblo.asia/p/php-autoloading-psr4-and-composer-V3m5Wy0QZO7
Last updated
Rất nhiều PHP developer hiện nay và kể cả phần lớn các framework đều chọn cách viết code theo mô hình lập trình hướng đối tượng. Một trong những best practice, convention khi viết OOP đó là mỗi class sẽ được viết riêng vào 1 file. Nhưng có một vấn đề đối với practice này đó là chúng ta phải include/require
cả list dài các file class trước khi sử dụng chúng.
Vâng, nhưng đó là vấn đề của PHP < 5, xưa lắm rồi Từ PHP 5 trở đi, chúng ta có thể sử dụng feature autoloading để tự động load các class khi chúng được gọi. Mục đích của bài viết này là thảo luận về cách hoạt động, cách thực hiện autoload theo cách thông thường và thực hiện autoload bằng Composer.
Một ví dụ đơn giản, thay vì viết:
Thì chúng ta sẽ dùng autoloading:
Các class sẽ tự động được load thay vì phải include/require
từng file.
Để thực hiện autoloading, chúng ta phải hướng dẫn cho PHP cách load các file class đó, vì có nhiều quy tắt đặt tên, cách tổ chức file, folder mà, mỗi nguời mỗi ý, không nói ra thì làm sao biết??
Từ thưở mới bắt đầu, PHP 5.0, người ta sử dụng magic function __autoload()
để thực hiện ra công văn chỉ đạo cho PHP thực hiện autoload. Tuy nhiên, do có nhiều hạn chế nên bắt đầu từ PHP 5.1 thì PHP đưa ra thêm function spl_autoload_register()
, khuyên dùng hàm này thay cho __autoload()
và cho đến phiên bản PHP 7.2.0 thì function __autoload()
đã bị DEPRECATED, sẽ bị xóa trong tương lai gần.
Cụ thể __autoload()
là một magic function, muốn sử dụng nó bạn định nghĩa nó, tức là bạn phải viết 1 function có tên là __autoload
, nhận tham số là tên class muốn load.
VD, convention của project là viết các file class vào thư mục src/classes/
, chúng ta sẽ thực hiện autoload như sau:
File src/classes/Foo.php
:
File src/classes/Bar.php
:
File src/index.php
:
Với cách này, bạn chỉ có thể có định nghĩa 1 function __autoload()
, vì thế nếu bạn sử dụng một thư viện nào đó cũng sử dụng function này thì sẽ gây conflict và sẽ có lỗi do định nghĩa 2 hàm trùng tên.
Khác với __autoload()
thì spl_autoload_register()
là một function thông thường, muốn sử dụng nó thì bạn gọi đến nó chứ không phải định nghĩa nó, và tất nhiên là chúng ta có thể gọi nó nhiều lần.
Như bạn thấy, function này sẽ nhận tham số là một callback function, callback này có nhiệm vụ giống như __autoload()
. Nếu có nhiều hàm callback autoload, PHP sẽ tạo 1 queue và thực hiện lần lượt theo thứ tự hàm callback được định nghĩa trong lời gọi hàm spl_autoload_register()
cho đến khi nó tìm được class, và nếu sau khi chạy qua tất cả autoload mà không tìm thấy class thì sẽ có exception class not found.
VD thay thế cho __autoload()
:
VD nhiều autoload callback, load class trong 2 thư mục includes
và classes
:
Output khi chạy:
Nếu thay đổi thứ tự autoload callback:
Output thế nào chắc các bạn cũng biết được.
Trường hợp class không tồn tại:
=>
Việc mỗi người, mỗi dự án có một cách thức thực hiện autoloading làm cho việc chia sẻ dùng lại code giữa các framework, thư viện trở nên phức tạp. Do đó, chuẩn PSR-4 Autoloader được tạo ra để thống nhất một quy tắc trong việc thực hiện autoloading. Các framework như Laravel, Symfony, Phalcon... đều dùng chuẩn này (tham khảo file composer.json
). Tiêu chuẩn này mô tả các quy tắc tổ chức namespace trong class, cũng như cách tổ chức tên file, folder của class tương ứng. Trước chuẩn này còn có chuẩn PSR-0, tuy nhiên nó đã lỗi thời, các bạn có thể tự tham khảo và so sánh với chuẩn PSR-4.
Nội dung chính của chuẩn PSR-4 đó là: Quy tắc tổ chức các thư mục code sao cho mọi class (bao gồm class, interface, trait) đều có thể được tham chiếu đến bằng cách viết mã như sau:
NamespaceName
: Tiền tố đầu tiên bắt buộc phải có - có thể hiểu là tên vendor.
SubNamespaceNames
: Các namespace con (theo sau NamespaceName đầu tiên). Có thể một hoặc nhiều.
Các namespace liền kề nhau ở đầu có thể kết hợp tạo thành namespace prefix và tương ứng với ít nhất một base directory. Nhưng bắt đầu từ SubNamespace sau namespace prefix thì nó phải tương ứng với một thư mục con bên trong base directory, tên thư mục phải trùng với tên SubNamespace.
ClassName
: Bắt buộc phải có tên file trùng với tên lớp ClassName, nằm trong thư mục con tương ứng với namespace cuối cùng.
Ví dụ về cách tổ chức:
Tham chiếu đến class
Namespace prefix
Base directory
Class File Path
\Acme\Log\Writer\File_Writer
Acme\Log\Writer
./src/lib/
=>
./src/lib/File_Writer.php
\Symfony\Core\Request
Symfony\Core
./vendor/Symfony/Core/
=>
./vendor/Symfony/Core/Request.php
\App\Http\Web\HomeController
App
./src/
=>
./src/Http/Web/HomeController.php
\App\Utility\Class_Name
App
./src/
=>
./src/Utility/Class_Name.php
Sự khác biệt chủ yếu của PSR-0 so với PSR-4 đó là, PSR-0 không có khái niệm namespace prefix nên cấu trúc namespace sẽ tương ứng với cấu trúc thư mục chứa class. Ngoài ra PSR-0 còn sử dụng thêm dấu gạch dưới _
trong ClassName để thể hiện các thư mục bổ sung chứa class theo sau các tên namespace. Một Lưu ý nữa đó là, dấu _
chỉ có ý nghĩa đặc biệt trong tên class, còn trong tên của namespace thì không.
VD về cách tổ chức class theo PSR-0:
Tham chiếu đến class
Code directory
Class File Path
\Acme\Log\Writer\File_Writer
./src/lib/
=>
./src/lib/Acme/Log/Writer/File/Writer.php
\Symfony\Core\Request
./vendor/
=>
./vendor/Symfony/Core/Request.php
\App\Http\Web\HomeController
./src/
=>
./src/App/Http/Web/HomeController.php
\App\Utility\Class_Name
./src/
=>
./src/App/Utility/Class/Name.php
\App\Active_Record\Class_Name
./src/
=>
./src/App/Active_Record/Class/Name.php
Ngoài ra còn một yêu cầu đối với autoloader (autoload function, callback) đó là: Autoloader không được ném ra bất cứ exception nào, không được gây ra bất cứ lỗi hay warning nào, và không nên trả về giá trị.
Đó là cách thống nhất viết bố trí code PHP trên các thư mục và theo các namespace. Khi đã viết code tuân thủ theo hướng dẫn này thì các framework khác nhau đều sử dụng một cơ chế tự động nạp tương tự nhau nên việc chia sẻ, tích hợp là rất linh hoạt.
Ví dụ implement một autoloader (source):
https://www.php-fig.org/psr/psr-4/examples/
https://www.php-fig.org/psr/psr-4/meta/
The purpose is to specify the rules for an interoperable PHP autoloader that maps namespaces to file system paths, and that can co-exist with any other SPL registered autoloader. This would be an addition to, not a replacement for, PSR-0.
The PSR-0 class naming and autoloading standard rose out of the broad acceptance of the Horde/PEAR convention under the constraints of PHP 5.2 and previous. With that convention, the tendency was to put all PHP source classes in a single main directory, using underscores in the class name to indicate pseudo-namespaces, like so:
With the release of PHP 5.3 and the availability of namespaces proper, PSR-0 was introduced to allow both the old Horde/PEAR underscore mode and the use of the new namespace notation. Underscores were still allowed in the class name to ease the transition from the older namespace naming to the newer naming, and thereby to encourage wider adoption.
This structure is informed very much by the fact that the PEAR installer moved source files from PEAR packages into a single central directory.
With Composer, package sources are no longer copied to a single global location. They are used from their installed location and are not moved around. This means that with Composer there is no “single main directory” for PHP sources as with PEAR. Instead, there are multiple directories; each package is in a separate directory for each project.
To meet the requirements of PSR-0, this leads to Composer packages looking like this:
The “src” and “tests” directories have to include vendor and package directory names. This is an artifact of PSR-0 compliance.
Many find this structure to be deeper and more repetitive than necessary. This proposal suggests that an additional or superseding PSR would be useful so that we can have packages that look more like the following:
This would require an implementation of what was initially called “package-oriented autoloading” (as vs the traditional “direct class-to-file autoloading”).
It’s difficult to implement package-oriented autoloading via an extension or amendment to PSR-0, because PSR-0 does not allow for an intercessory path between any portions of the class name. This means the implementation of a package-oriented autoloader would be more complicated than PSR-0. However, it would allow for cleaner packages.
Initially, the following rules were suggested:
Implementors MUST use at least two namespace levels: a vendor name, and package name within that vendor. (This top-level two-name combination is hereinafter referred to as the vendor-package name or the vendor-package namespace.)
Implementors MUST allow a path infix between the vendor-package namespace and the remainder of the fully qualified class name.
The vendor-package namespace MAY map to any directory. The remaining portion of the fully-qualified class name MUST map the namespace names to identically-named directories, and MUST map the class name to an identically-named file ending in .php.
Note that this means the end of underscore-as-directory-separator in the class name. One might think underscores should be honored as they are under PSR-0, but seeing as their presence in that document is in reference to transitioning away from PHP 5.2 and previous pseudo-namespacing, it is acceptable to remove them here as well.
Retain the PSR-0 rule that implementors MUST use at least two namespace levels: a vendor name, and package name within that vendor.
Allow a path infix between the vendor-package namespace and the remainder of the fully qualified class name.
Allow the vendor-package namespace MAY map to any directory, perhaps multiple directories.
End the honoring of underscores in class names as directory separators
Provide a general transformation algorithm for non-class resources
This approach retains key characteristics of PSR-0 while eliminating the deeper directory structures it requires. In addition, it specifies certain additional rules that make implementations explicitly more interoperable.
Although not related to directory mapping, the final draft also specifies how autoloaders should handle errors. Specifically, it forbids throwing exceptions or raising errors. The reason is two-fold.
Autoloaders in PHP are explicitly designed to be stackable so that if one autoloader cannot load a class another has a chance to do so. Having an autoloader trigger a breaking error condition violates that compatibility.
class_exists()
and interface_exists()
allow “not found, even after trying to autoload” as a legitimate, normal use case. An autoloader that throws exceptions renders class_exists()
unusable, which is entirely unacceptable from an interoperability standpoint. Autoloaders that wish to provide additional debugging information in a class-not-found case should do so via logging instead, either to a PSR-3 compatible logger or otherwise.
Pros:
Shallower directory structures
More flexible file locations
Stops underscore in class name from being honored as directory separator
Makes implementations more explicitly interoperable
Cons:
It is no longer possible, as under PSR-0, to merely examine a class name to determine where it is in the file system (the “class-to-file” convention inherited from Horde/PEAR).
Staying with PSR-0 only, although reasonable, does leave us with relatively deeper directory structures.
Pros:
No need to change anyone’s habits or implementations
Cons:
Leaves us with deeper directory structures
Leaves us with underscores in the class name being honored as directory separators
Beau Simensen and others suggested that the transformation algorithm might be split out from the autoloading proposal so that the transformation rules could be referenced by other proposals. After doing the work to separate them, followed by a poll and some discussion, the combined version (i.e., transformation rules embedded in the autoloader proposal) was revealed as the preference.
Pros:
Transformation rules could be referenced separately by other proposals
Cons:
Not in line with the wishes of poll respondents and some collaborators
After the second vote was pulled by a Sponsor after hearing from multiple +1 voters that they supported the idea but did not agree with (or understand) the wording of the proposal, there was a period during which the voted-on proposal was expanded with greater narrative and somewhat more imperative language. This approach was decried by a vocal minority of participants. After some time, Beau Simensen started an experimental revision with an eye to PSR-0; the Editor and Sponsors favored this more terse approach and shepherded the version now under consideration, written by Paul M. Jones and contributed to by many.
PHP versions before 5.3.3 do not strip the leading namespace separator, so the responsibility to look out for this falls on the implementation. Failing to strip the leading namespace separator could lead to unexpected behavior.
Paul M. Jones, Solar/Aura
Phil Sturgeon, PyroCMS (Coordinator)
Larry Garfield, Drupal
Andreas Hennings
Bernhard Schussek
Beau Simensen
Donald Gilbert
Mike van Riel
Paul Dragoonis
Too many others to name and count
Acceptance Vote:
1st attempt: https://groups.google.com/forum/#!topic/php-fig/Ua46E344_Ls, presented prior to new workflow; aborted due to accidental proposal modification
2nd attempt: https://groups.google.com/forum/#!topic/php-fig/NWfyAeF7Psk, cancelled at the discretion of the sponsor https://groups.google.com/forum/#!topic/php-fig/t4mW2TQF7iE
3rd attempt: TBD
https://www.php-fig.org/psr/psr-4/
This PSR describes a specification for autoloading classes from file paths. It is fully interoperable, and can be used in addition to any other autoloading specification, including PSR-0. This PSR also describes where to place files that will be autoloaded according to the specification.
The term “class” refers to classes, interfaces, traits, and other similar structures.
A fully qualified class name has the following form:
The fully qualified class name MUST have a top-level namespace name, also known as a “vendor namespace”.
The fully qualified class name MAY have one or more sub-namespace names.
The fully qualified class name MUST have a terminating class name.
Underscores have no special meaning in any portion of the fully qualified class name.
Alphabetic characters in the fully qualified class name MAY be any combination of lower case and upper case.
All class names MUST be referenced in a case-sensitive fashion.
When loading a file that corresponds to a fully qualified class name …
A contiguous series of one or more leading namespace and sub-namespace names, not including the leading namespace separator, in the fully qualified class name (a “namespace prefix”) corresponds to at least one “base directory”.
The contiguous sub-namespace names after the “namespace prefix” correspond to a subdirectory within a “base directory”, in which the namespace separators represent directory separators. The subdirectory name MUST match the case of the sub-namespace names.
The terminating class name corresponds to a file name ending in .php
. The file name MUST match the case of the terminating class name.
Autoloader implementations MUST NOT throw exceptions, MUST NOT raise errors of any level, and SHOULD NOT return a value.
The table below shows the corresponding file path for a given fully qualified class name, namespace prefix, and base directory.
FULLY QUALIFIED CLASS NAME
NAMESPACE PREFIX
BASE DIRECTORY
RESULTING FILE PATH
\Acme\Log\Writer\File_Writer
Acme\Log\Writer
./acme-log-writer/lib/
./acme-log-writer/lib/File_Writer.php
\Aura\Web\Response\Status
Aura\Web
/path/to/aura-web/src/
/path/to/aura-web/src/Response/Status.php
\Symfony\Core\Request
Symfony\Core
./vendor/Symfony/Core/
./vendor/Symfony/Core/Request.php
\Zend\Acl
Zend
/usr/includes/Zend/
/usr/includes/Zend/Acl.php
For example implementations of autoloaders conforming to the specification, please see the examples file. Example implementations MUST NOT be regarded as part of the specification and MAY change at any time.
Để thực hiện autoloading với Composer bạn cần khai báo trong file composer.json
. Composer hỗ trợ các kiểu autoload PSR-4, PSR-0, classmap và files, các bạn có thể tham khảo tài liệu gốc.
Ở đây, mình sẽ ví dụ autoload PSR-4 với Composer.
Ví dụ bạn có cấu trúc thư mục như sau:
File src/Models/User.php
:
Tương tự file src/Controllers/HomeController.php
sẽ có namespace Viblo\Controllers
.
Thư mục Views gồm những file markup PHP, Html nên sẽ không thực hiện autoload.
Tiếp theo, chúng ta có file composer.json
:
Sau đó chạy lệnh:
Câu lệnh này sẽ tạo ra file autoloader vendor/autoload.php
, autoloader này sẽ load các rule được implement trong vendor/composer/autoload_*.php
.
Sử dụng index.php
:
Với các quy tắc PSR-0, PSR-4, autoloader cần phải check sự tồn tại của class file trong filesystem trước khi load class. Việc này có thể làm chậm tốc độc của application một chút, nhưng bù lại nó làm cho việc develop dễ dàng hơn khi bạn thêm một class và có thể sử dụng nó ngay lập tức mà không phải rebuild autoloader.
Vấn đề ở đây là, trong môi trường production, bạn thường muốn app của mình chạy nhanh nhất có thể, vì môi trường này ít khi thay đổi và bạn có thể dễ dàng rebuild lại autoloader khi deploy.
Vì lý do này, Composer cung cấp vài phương pháp để optimize autoloader. Mình sẽ giới thiệu 1 phương pháp thường được sử dụng nhất.
Optimization Level 1: Class map generation
Làm sao để bật chế độ này?
Có một vài tùy chọn để bạn bật chế độ optimization này:
Thiết lập trong file composer.json
Chạy composer install
hoặc composer update
với option -o
hay --optimize-autoloader
Chạy composer dump-autoload
với option -o
/ --optimize
Nó hoạt động như thế nào?
Composer sẽ convert các rule PSR-4/PSR-0 sang classmap rule. Các bạn có thể xem file vendor/composer/autoload_classmap.php
để kiểm tra. File này sẽ return một array, có key là tên class đầy đủ và value là đường dẫn đến class. Composer đã check sự tồn tại của các class này trước và generate ra classmap, do đó, khi tham chiếu đến class thì autoloader chỉ việc require file vào không cần phải check filesystem nữa.
Với PHP 5.6+, Composer còn thực hiện cache classmap trong opcache
, làm cho việc load class có thể chạy nhanh nhất có thể.
Nhược điểm
Không có nhược điểm thực sự với phương pháp này, và bạn nên luôn luôn dùng nó trong môi trường production.
Một vấn đề nhỏ với ở đây là, nếu class không tồn tại trong classmap, nó sẽ có fallback về PSR-4 rule, tức là tiếp tục follow theo PSR-4 rule và có thể phát sinh filesystem check.
Để giải quyết vấn đề này Composer cung cấp thêm 2 phương pháp optimize level 2 đó là Level 2/A: Authoritative class maps (loại bỏ fallback về PSR-4 rule) và Level 2/B: APCu cache (sử dụng apcu
cache). Hai option level 2 này không thể được sử dụng cùng 1 lúc và cũng ít được sử dụng.
Ngoài ra còn 1 vấn đề nữa mình phát hiện trong quá trình tham gia một project, đó là khi sử dụng optimize thì rule PSR-4 sẽ không được đảm bảo về ràng buộc giữa class namespaces và thư mục chứa class. Tức là, vd 1 class là
App\User
nhưng lại được đặt trong thư mục khác, chẳng hạnapp/Http/Models/User.php
thay vìapp/User.php
.Đây cũng không phải là vấn đề lớn và vẫn đang được thảo luận, các bạn có thể theo dõi tại issue này.
Có thể nói Autoloading là một feature của "modern" PHP. Hy vọng qua bài viết này các bạn có thể áp dụng nhiều hơn vào các project của mình.
https://www.php-fig.org/psr/psr-4/examples/
The following examples illustrate PSR-4 compliant code:
The following is an example class implementation to handle multiple namespaces:
The following example is one way of unit testing the above class loader:
Nếu không optimize, sẽ có lỗi class not found khi sử dụng class App\User
nhưng project này lại để hẳn config optimize-autoloader trong file composer.json nên làm mình không để ý, gây khó hiểu khi đọc code