REDSHIFT : attribuez une valeur dans la colonne à toutes les lignes en fonction d'une certaine valeur dans une autre colonne

Michi Publié le Dev

Michi

CREATE TABLE customers (
    id SERIAL PRIMARY KEY,
    order_date DATE,
    country VARCHAR(255),
    customer VARCHAR(255)
);

INSERT INTO customers
(order_date, country, customer)
VALUES 
('2020-04-10', 'DE', 'user_01'),
('2020-04-11', 'DE', 'user_01'),
('2020-04-13', 'AT', 'user_01'),

('2020-04-20', 'AT', 'user_02'),
('2020-04-22', 'AT', 'user_02'),

('2020-05-19', 'DE', 'user_03'),

('2020-06-17', 'AT', 'user_04'),
('2020-06-23', 'AT', 'user_04'),
('2020-07-04', 'DE', 'user_04'),

('2020-08-19', 'NL', 'user_05'),
('2020-10-23', 'FR', 'user_05');

Résultat attendu:

order_date   |   customer  |  first_country   |   second_country  | 
-------------|-------------|------------------|-------------------|-----------
2020-04-10   |   user_01   |       DE         |         DE        |
2020-04-11   |   user_01   |       DE         |         DE        |
2020-04-13   |   user_01   |       AT         |         DE        |
-------------|-------------|------------------|-------------------|-----------             
2020-04-20   |   user_02   |       AT         |        NULL       |
2020-04-22   |   user_02   |       AT         |        NULL       |
-------------|-------------|------------------|-------------------|-----------          
2020-05-19   |   user_03   |       DE         |        NULL       | 
-------------|-------------|------------------|-------------------|----------- 
2020-06-17   |   user_04   |       AT         |         DE        |
2020-06-23   |   user_04   |       AT         |         DE        |
2020-07-04   |   user_04   |       DE         |         DE        |
-------------|-------------|------------------|-------------------|----------- 
2020-08-19   |   user_05   |       NL         |        NULL       |
2020-10-23   |   user_05   |       FR         |        NULL       |

Dans l'exemple ci-dessus, il peut arriver qu'un client ait commandé à la fois en DEet en AT.
Pour ces clients, je souhaite attribuer le pays DEdans la colonne second_countryà chacun de leurs fichiers order_dates.

En référence à la réponse à cette question, j'ai essayé d'aller avec ceci:

SELECT
c.order_date AS order_date,
c.customer AS customer,
c.country AS first_country,

(CASE WHEN COUNT(*) FILTER (WHERE c.country = 'DE') OVER (PARTITION BY c.customer) > 0 AND
           COUNT(*) FILTER (WHERE c.country = 'AT') OVER (PARTITION BY c.customer) > 0
      THEN 'DE'
      END) AS second_country
        
FROM customers c

GROUP BY 1,2,3
ORDER BY 1,2,3;

Cependant, dans redshiftla FILTERfonction n'est pas disponible.
Comment dois-je modifier la requête pour qu'elle fonctionne également redshift?

Gordon Linoff

Utilisez simplement des caseexpressions :

SELECT c.order_date AS order_date,
       c.customer AS customer,
       c.country AS first_country,
       (CASE WHEN SUM(CASE WHEN c.country = 'DE' THEN 1 ELSE 0 END) OVER (PARTITION BY c.customer) > 0 AND
                  SUM(CASE WHEN c.country = 'AT' THEN 1 ELSE 0 END) OVER (PARTITION BY c.customer) > 0
             THEN 'DE'
         END) AS second_country        
FROM customers c
GROUP BY 1,2,3
ORDER BY 1,2,3;

En fait, vous pouvez simplifier cela en :

       (CASE WHEN SUM( (c.country = 'DE')::int ) OVER (PARTITION BY c.customer) > 0 AND
                  SUM( (c.country = 'DE')::int ) OVER (PARTITION BY c.customer) > 0
             THEN 'DE'
        END) AS second_country

Cet article est collecté sur Internet, veuillez indiquer la source lors de la réimpression.

En cas d'infraction, veuillez [email protected] Supprimer.

modifier le2021-08-31

laisse moi dire quelques mots

0commentaires

connexionAprès avoir participé à la revue

Article précédent:Comment changer le débit binaire de l'audio lors de la conversion d'un fichier midi en mp3 à l'aide de ffmpeg/fluidsynth

TOP liste

article