Лучшее регулярное выражение для проверки адресов электронной почты

Лучшее регулярное выражение для проверки адресов электронной почты
PHP

Эффективные методы проверки электронной почты

За прошедшие годы я постепенно разработал регулярное выражение, которое правильно проверяет большинство адресов электронной почты, при условии, что они не используют IP-адрес в качестве серверной части. Это регулярное выражение используется в нескольких программах PHP и обычно работает хорошо.

Однако время от времени я получаю отзывы от пользователей, испытывающих проблемы с сайтом, использующим это регулярное выражение. Это часто требует корректировок, таких как обновление регулярного выражения для соответствия четырехсимвольным TLD. Какое регулярное выражение для проверки адресов электронной почты вам встречалось лучше всего?

Команда Описание
preg_match Выполняет сопоставление с регулярным выражением в PHP и возвращает 1, если шаблон соответствует, и 0 в противном случае.
regex.test() Проверяет совпадение в JavaScript с использованием регулярного выражения и возвращает true, если совпадение найдено, и false в противном случае.
re.match() Проверяет совпадение в Python с помощью регулярного выражения и возвращает объект соответствия, если шаблон соответствует, в противном случае — None.
/^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}$/ Шаблон регулярного выражения, используемый для проверки адресов электронной почты путем сопоставления буквенно-цифровых символов, специальных символов и допустимых доменных имен.
echo Выводит одну или несколько строк в PHP. Используется для отображения результата проверки электронной почты.
console.log() Выводит сообщение на веб-консоль на языке JavaScript, что полезно для отладки и отображения результатов проверки.
print() Выводит указанное сообщение на консоль или стандартный вывод Python.

Понимание сценариев проверки электронной почты

Предоставленные сценарии демонстрируют, как проверять адреса электронной почты с помощью регулярных выражений на разных языках программирования: PHP, JavaScript и Python. Каждый сценарий работает по аналогичной схеме: определение функции для выполнения проверки, применение регулярного выражения к входному электронному письму и проверка на совпадение. В PHP-скрипте preg_match Функция используется для сопоставления электронного письма с шаблоном регулярного выражения. Эта функция возвращает 1, если шаблон соответствует входному адресу электронной почты, и 0 в противном случае. Используемое регулярное выражение, /^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}$/, разработан в соответствии с типичными форматами электронной почты, позволяя использовать в TLD буквенно-цифровые символы, специальные символы и допустимые доменные имена длиной два или более символов.

В примере JavaScript функция regex.test() используется для проверки электронной почты на соответствие тому же шаблону регулярных выражений. Эта функция возвращает true, если электронное письмо соответствует шаблону, и false, если нет. Результат затем записывается на консоль с помощью console.log(), что полезно для целей отладки. Аналогично, сценарий Python использует re.match() функция для проверки совпадения. Если электронное письмо соответствует регулярному выражению, возвращается объект соответствия; в противном случае возвращается None. Результат проверки выводится на консоль с помощью print() функция. Эти сценарии предоставляют простой способ проверки адресов электронной почты с помощью регулярных выражений, гарантируя, что вводимые данные соответствуют ожидаемому формату.

Комплексный PHP-скрипт для проверки электронной почты

PHP-код для проверки одного регулярного выражения

<?php
// Function to validate email address
function validateEmail($email) {
    // Regular expression for email validation
    $regex = '/^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}$/';
    // Return true if email matches regex, false otherwise
    return preg_match($regex, $email) === 1;
}
// Example usage
$email = "example@example.com";
if (validateEmail($email)) {
    echo "Valid email address.";
} else {
    echo "Invalid email address.";
}
?>

Решение JavaScript для проверки электронной почты

Код JavaScript с использованием регулярного выражения

<!DOCTYPE html>
<html>
<head>
    <title>Email Validation</title>
</head>
<body>
    <script>
    // Function to validate email address
    function validateEmail(email) {
        // Regular expression for email validation
        var regex = /^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}$/;
        // Return true if email matches regex, false otherwise
        return regex.test(email);
    }
    // Example usage
    var email = "example@example.com";
    if (validateEmail(email)) {
        console.log("Valid email address.");
    } else {
        console.log("Invalid email address.");
    }
    </script>
</body>
</html>

Скрипт Python для проверки электронной почты

Код Python с использованием регулярного выражения

import re
def validate_email(email):
    # Regular expression for email validation
    regex = r'^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}$'
    # Return true if email matches regex, false otherwise
    return re.match(regex, email) is not None
# Example usage
email = "example@example.com"
if validate_email(email):
    print("Valid email address.")
else:
    print("Invalid email address.")

Расширенные методы проверки электронной почты

Проверка электронной почты с использованием регулярных выражений может быть сложной из-за большого разнообразия допустимых форматов электронной почты. Одним из аспектов, который часто упускают из виду, является обработка интернационализированных доменных имен (IDN) и адресов электронной почты с символами Юникода. Современные приложения должны поддерживать пользователей по всему миру, поэтому им следует рассмотреть возможность использования регулярных выражений, способных обрабатывать такие случаи. Например, в IDN используются символы, отличные от ASCII, а это означает, что типичное регулярное выражение может не правильно их проверить.

Кроме того, обеспечение соответствия таким стандартам, как RFC 5321 и RFC 5322, может повысить надежность проверки электронной почты. В этих стандартах описываются спецификации форматов адресов электронной почты, включая допустимые символы и общую структуру. Приводя регулярное выражение в соответствие с этими стандартами, разработчики могут создавать более надежные сценарии проверки. Например, разрешение комментариев внутри адресов электронной почты или правильная обработка строк в кавычках может иметь решающее значение для полного соответствия требованиям.

Часто задаваемые вопросы о проверке электронной почты

  1. Какое регулярное выражение лучше всего подходит для проверки адресов электронной почты?
  2. Часто используемое регулярное выражение: /^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}$/, который соответствует большинству форматов электронной почты.
  3. Могут ли регулярные выражения обрабатывать все допустимые форматы электронной почты?
  4. Нет, некоторые крайние случаи, такие как интернационализированные адреса электронной почты, не могут быть обработаны простыми регулярными выражениями.
  5. Как я могу проверить адреса электронной почты с международными доменами?
  6. Вы можете использовать более сложное регулярное выражение или использовать библиотеки, предназначенные для международной проверки электронной почты.
  7. Каковы некоторые ограничения использования регулярных выражений для проверки электронной почты?
  8. Регулярные выражения могут не охватывать все крайние случаи и могут стать слишком сложными. Они также не проверяют существование домена или адреса электронной почты.
  9. Существует ли стандарт RFC для адресов электронной почты?
  10. Да, RFC 5321 и RFC 5322 определяют стандарты форматов и спецификаций адресов электронной почты.
  11. Почему действующий адрес электронной почты может не пройти проверку?
  12. Проблемы могут возникнуть из-за того, что строгие регулярные выражения не учитывают определенные допустимые символы или форматы, такие как длинные TLD или специальные символы.
  13. Должен ли я использовать проверку электронной почты на стороне сервера или на стороне клиента?
  14. Оба варианта рекомендуются. Проверка на стороне клиента обеспечивает немедленную обратную связь, а проверка на стороне сервера обеспечивает безопасность и точность.
  15. Как я могу обрабатывать проверку электронной почты для форм регистрации пользователей?
  16. Используйте регулярные выражения для первоначальной проверки, а затем проверяйте домен или отправляйте электронное письмо с подтверждением.
  17. Могу ли я использовать регулярные выражения для проверки одноразовых адресов электронной почты?
  18. Хотя вы можете попытаться отфильтровать распространенные одноразовые почтовые домены, лучше использовать для этой цели специализированные сервисы.
  19. Какие инструменты доступны для проверки электронной почты?
  20. Библиотеки и API, такие как EmailVerifyAPI, Hunter.io, а также встроенные функции проверки в платформах, могут улучшить проверку электронной почты.

Заключительные мысли о проверке электронной почты

Проверка адресов электронной почты с помощью регулярных выражений может оказаться сложной задачей из-за разнообразия используемых форматов и стандартов. Используя комплексные и тщательно разработанные регулярные выражения, разработчики могут эффективно проверять большинство форматов электронной почты, в том числе со сложными доменными именами и специальными символами. Постоянное совершенствование и соблюдение таких стандартов, как RFC 5321 и RFC 5322, необходимы для поддержания точности и надежности этих сценариев проверки. Правильная проверка повышает удобство работы пользователей и гарантирует сохранение целостности данных в веб-приложениях.