Listado completo de tutoriales

34 - Registros duplicados (distinct)


Con la cláusula "distinct" se especifica que los registros con ciertos datos duplicados sean obviadas en el resultado. Por ejemplo, queremos conocer todos los autores de los cuales tenemos libros, si utilizamos esta sentencia:

 select autor from libros;

Aparecen repetidos. Para obtener la lista de autores sin repetición usamos:

 select distinct autor from libros;

También podemos tipear:

 select autor from libros
  group by autor;

Note que en los tres casos anteriores aparece "null" como un valor para "autor"· Si sólo queremos la lista de autores conocidos, es decir, no queremos incluir "null" en la lista, podemos utilizar la sentencia siguiente:

 select distinct autor from libros
  where autor is not null;

Para contar los distintos autores, sin considerar el valor "null" usamos:

 select count(distinct autor)
  from libros;

Note que si contamos los autores sin "distinct", no incluirá los valores "null" pero si los repetidos:

 select count(autor)
  from libros;

Esta sentencia cuenta los registros que tienen autor.

Podemos combinarla con "where". Por ejemplo, queremos conocer los distintos autores de la editorial "Planeta":

 select distinct autor from libros
  where editorial='Planeta';

También puede utilizarse con "group by" para contar los diferentes autores por editorial:

 select editorial, count(distinct autor)
  from libros
  group by editorial;

La cláusula "distinct" afecta a todos los campos presentados. Para mostrar los títulos y editoriales de los libros sin repetir títulos ni editoriales, usamos:

 select distinct titulo,editorial
  from libros
  order by titulo;

Note que los registros no están duplicados, aparecen títulos iguales pero con editorial diferente, cada registro es diferente.

Entonces, "distinct" elimina registros duplicados.

Ingresemos el siguiente lote de comandos SQL en pgAdmin:

 drop table if exists libros;
 
 create table libros(
  codigo serial,
  titulo varchar(40),
  autor varchar(30),
  editorial varchar(15),
  primary key(codigo)
 );

 insert into libros(titulo,autor,editorial)
  values('El aleph','Borges','Planeta');
 insert into libros(titulo,autor,editorial)
  values('Martin Fierro','Jose Hernandez','Emece');
 insert into libros(titulo,autor,editorial)
  values('Martin Fierro','Jose Hernandez','Planeta');
 insert into libros(titulo,autor,editorial)
  values('Antologia poetica','Borges','Planeta');
 insert into libros(titulo,autor,editorial)
  values('Aprenda PHP','Mario Molina','Emece');
 insert into libros(titulo,autor,editorial)
  values('Aprenda PHP','Lopez','Emece');
 insert into libros(titulo,autor,editorial)
  values('Manual de PHP', 'J. Paez', null);
 insert into libros(titulo,autor,editorial)
  values('Cervantes y el quijote',null,'Paidos');
 insert into libros(titulo,autor,editorial)
  values('Harry Potter y la piedra filosofal','J.K. Rowling','Emece');
 insert into libros(titulo,autor,editorial)
  values('Harry Potter y la camara secreta','J.K. Rowling','Emece');
 insert into libros(titulo,autor,editorial)
  values('Alicia en el pais de las maravillas','Lewis Carroll','Paidos');
 insert into libros(titulo,autor,editorial)
  values('Alicia en el pais de las maravillas','Lewis Carroll','Planeta');
 insert into libros(titulo,autor,editorial)
  values('PHP de la A a la Z',null,null);
 insert into libros(titulo,autor,editorial)
  values('Uno','Richard Bach','Planeta');

 --Para obtener la lista de autores sin repetición tipeamos:
 select distinct autor from libros;

 -- Note que aparece "null" como un valor para "autor"· 
 -- Para obtener la lista de autores conocidos, es decir, no incluyendo
 -- "null" en la lista:
 select distinct autor from libros
  where autor is not null;

 -- Contamos los distintos autores:
 select count(distinct autor)
  from libros;

 -- Queremos los nombres de las editoriales sin repetir:
 select distinct editorial from libros;

 -- Queremos saber la cantidad de editoriales distintas:
 select count(distinct editorial) from libros;

 -- La combinamos con "where" para obtener los distintos
 -- autores de la editorial "Planeta":
 select distinct autor from libros
  where editorial='Planeta';

 -- Contamos los distintos autores que tiene cada editorial
 -- empleando "group by":
 select editorial,count(distinct autor)
  from libros
  group by editorial;

  -- Mostramos los títulos y editoriales de los libros sin 
  -- repetir títulos ni editoriales:
 select distinct titulo,editorial
  from libros
  order by titulo;

La ejecución de este lote de comandos SQL genera una salida similar a:

PostgreSQL pgAdmin distinct


Retornar